设为首页 收藏本站
查看: 1067|回复: 0

[经验分享] Hadoop安装备忘

[复制链接]

尚未签到

发表于 2018-10-30 10:35:57 | 显示全部楼层 |阅读模式
  参考刘鹏的《实战Hadoop》一书,按照hadoop 0.20.2几个注意的地方。
  第一,首先理解Hadoop中的几个后台进程。
  NameNode,Secondary NameNode,JobTracker,TaskTracker,DataNode这几个角色。
  NameNode:负责如何切分数据块,和切完放哪个节点。它对内存和I/O集中管理。
  这个进程部署在Master节点上,是一个单点,它挂了整个系统都挂了。
  Secondary NameNode:和NameNode一样,辅助程序。每个集群都有一个,它与NameNode进行通讯,定期保存HDFS元数据快照,当NameNode故障可以作为备用NameNode使用。它也是部署在Master节点上。
  JobTracker负责调度作业,它决定哪些文件由哪些节点运行,并且监听TaskTracker发送来的心跳。当收不到心跳,即认为某个task失败,就会决定重启task。每个集群只有一个JobTracker。它是部署在Master节点上的。
  上述三个进程都是部署在Master节点上的,而TaskTracker和DataNode进程进程是集群中各个几点都需要部署的。
  DataNode负责将HDFS数据块读写到本地文件系统。当客户端读写某个数据库的时候,由NameNode告诉客户端去那个DataNode进行,然后客户端直接与这个DataNode的服务器通信,并操作相关的数据块。
  TaskTracker也是位于从节点的,它负责独立执行具体的Task,每个从节点只能有一个TaskTracker,但是每个TaskTracker可以产生多个Java虚拟机,用于并行处理多个map和reduce认为。TaskTracker还会和JobTracker交互,JobTasker负责分配Task,并且检测TaskTracker的心跳,如果没有心跳,就认为已经崩溃,并将认为分配给其他的TaskTracker。
  各个进程的部署图如下:
DSC0000.jpg

  具体的安装环节,可以参考书中的步骤,但是有几个点需要注意。
  主机和从机统一创建专门的运行hadoop的用户grid, 设置SSH的免密码登陆机制,可以参考http://chenlb.iteye.com/blog/211809。将所有的机器上的公钥文件上里的内容,都统一整合到一个authorized_keys文件,以此实现互相免密码登陆ssh。
  启动hadoop的时候,注意要以grid用户登录,在grid用户的主目录下进行操作,有时权限的问题,此时要注意将主机和从机的hadoop文件夹的owner设置为grid用户和组。执行 chown -R grid:grid /home/grid/hadoop-1.2.1   (此处为hadoop的放置目录,这里要使用root用户修改)
  然后可以到hadoop的文件夹中的bin目录下启动start-all.sh,可以看到如下的信息,说明启动成功。
DSC0001.jpg

  此时还可以通过运行命令查看进程的启动情况,在主机上运行jdk中的jps文件,可以看到如下:
DSC0002.jpg

  在从节点运行相同的命令,可以看到
DSC0003.jpg

  至此,说明安装Hadoop已经成功了。


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-628372-1-1.html 上篇帖子: 【总结】Hadoop中的Combiner实践 下篇帖子: 【总结】Hadoop中的MultipleOutputs实践
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表