[内容简介]
《Hadoop权威指南(版)(第3版)(修订版)》的内容包括:使用Hadoop分布式文件系统(HDFS)保存大数据集;使用MapReduce运行 分布式计算;使用Hadoop的数据和I/O构件实现压缩、数据完整性、序列化(包括Avro)和持久化;了解常见的陷阱和高级特性,以编写实用的 MapReduce程序;设计、构建和管理专用的Hadoop集群——或者在云中运行Hadoop;使用Sqoop从关系型数据库载入数据到HDFS;使 用Pig查询语言进行大规模数据处理;使用Hadoop的数据仓库系统Hive分析数据集;利用HBase处理结构化和半结构化数据,以及利用 ZooKeeper构建分布式系统。
[目录]
Foreword
Preface
1. Meet Hadoop
2. MapReduce
3. The Hadoop Distributed Filesystem
4. Hadoop I/O
5. Developing a MapReduce Application
6. How MapReduce Works
7. MapReduceTypes and Formats
8. MapReduce Features
9. Settinq Up a Hadoop Cluster
10. Administering Hadoop
11. Pig
12. Hive
13. HBase
14. ZooKeeper
15. Sqoop
16. Case Studies
A. Installing Apache Hadoop
B. Cloudera\'s Distribution Including Apache Hadoop
C. Preparing the NCDC Weather Data Index