Hadoop构建数据仓库实践
上QQ阅读APP看书,第一时间看更新

第4章 安装Hadoop

在前三章里介绍了数据仓库、Hadoop及其生态圈的基本概念,内容偏重于理论。从本章开始,让我们进入实践阶段。工欲善其事,必先利其器。既然我们要用Hadoop建立数据仓库,那么先要做的就是安装Hadoop。

本章首先介绍三种常见的Hadoop发行版本,之后说明ApacheHadoop的安装过程。为了解决NameNode的扩展性问题,Hadoop-0.23.0新增了HDFSFederation特性。本章将介绍HDFS Federation及其具体配置。在本章最后,将会详细说明CDH的离线安装步骤,本书后面的实践部分都是在CDH 5.7.0系统之上完成的。