![大数据技术入门(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/475/34752475/b_34752475.jpg)
上QQ阅读APP看书,第一时间看更新
2.9 AWS云平台上安装Hadoop
安装Hadoop的最简单的方法就是使用云平台(例如AWS)的Hadoop服务。EMR是AWS的Hadoop服务。下面阐述安装和配置EMR的步骤。从服务菜单中选择EMR,点击“create cluster”,如图2-27所示,填入集群名字,选择要安装的Hadoop的各个组件。我们选择了Hadoop和Spark。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P67_3959.jpg?sign=1738825065-tuhnFqIyL9wJMSSJs2Xuazu1RygU6Ty3-0-6a183e08c6787142b55e310e398bc887)
图2-27 创建Hadoop集群
如图2-28所示,指定Hadoop集群的硬件设置。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4004.jpg?sign=1738825065-TgrLQ61gq449rzPyyYz0LRM8nzxDDfLE-0-3fa20e4fee4ac112fd55dcc3f77e9f89)
图2-28 硬件配置
设置Hadoop集群的网络和安全设置。单击如图2-29所示的安全组的配置,就出现如图2-30所示的设置。然后,使用SSH登录到AWS的Master节点,就会出现如图2-31所示的界面,而后就可以输入Spark命令。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4005.jpg?sign=1738825065-n03HTJN1FBAJ4wiXhDRBIpUiSzHapH1k-0-19974a47d4c5b34f8925f515dde1ba71)
图2-29 网络和安全设置
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4006.jpg?sign=1738825065-tQ5k7W5HhpKpiBvzRpkefmMZVlYNqVBr-0-a32befb54ef2b9f30cb1d318c00d8115)
图2-30 安全组设置
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4007.jpg?sign=1738825065-4D4J3iUk33zugdMN9NKFDWqTcsyBwiVk-0-0b5b2e2fd630ca48b3dda557bafcdd00)
图2-31 Spark界面
除了使用SSH来操作Hadoop集群和Spark之外,还可以在如图2-32所示的界面中启动Zeppelin,随后就会出现如图2-33所示的界面。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4051.jpg?sign=1738825065-nbpXipRmwRpc7uYh4hEchkiFC0FdDvQG-0-2a8078b02d1176b7172b4f457bae3952)
图2-32 集群
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4052.jpg?sign=1738825065-4uPLM1WazVQg7V424BzLEa4icG8lqgoY-0-b1cdc6f9b9e76112912a42b20332e654)
图2-33 Zeppelin
之后,就可以输入Spark语句来操作集群上的数据(见图2-34,),查看日志信息(见图2-35)。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4053.jpg?sign=1738825065-ahAe4J8Zpuv5yc5uU3oENRNY6OsSN8Lf-0-96331701ec2d0510c4dc2e93530ade44)
图2-34 Spark操作
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4054.jpg?sign=1738825065-t6sjIVRZiZj40dYGwWo9JYkiIIGv2TF9-0-ab6c2285c4bdea822367bf7fe759844c)
图2-35 查看日志