设为首页 收藏本站
查看: 2076|回复: 0

[经验分享] 基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop集群安装

[复制链接]

尚未签到

发表于 2018-10-30 10:39:31 | 显示全部楼层 |阅读模式
  一、Cloudera Manager/CDH5
  1、关于cloudera manager和CDH是什么,这里不做详细介绍了。有官网和百科介绍。
  附上官网地址:cloudera manager
  2、官网的安装指南
  官方文档提供了三种安装方式:在线自动安装/手动安装包安装/手动使用cloudera manager管理安装
  此处使用第三种方式安装hadoop集群。
  二、环境规划
  1、系统:CentOS 6.4_x86
  master:4G内存,硬盘尽量大容量
  slave1:2G内存,硬盘尽量大容量
  slave2:2G内存,硬盘尽量大容量
  2、Cloudera Manager 5.3.3
  3、CDH 5.3.3
  安装包下载:

  •   Cloudera Manager 5.3.3:http://archive-primary.cloudera.com/cm5/cm/5/
  •   CDH 5.5.5:http://archive-primary.cloudera.com/cdh5/parcels/5.3.3/
  下载软件包:

  •   CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel
  •   CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha1
  •   manifest.json
  三、系统环境准备工作

  •   此次执行权限均为root用户
  •   所有的机器都必须ssh互信模式
  •   修改主机名使用hosts文件或者DNS服务器
  •   关闭iptables和selinux
  •   卸载系统自带的openjdk,安装oracle的jdk
  •   master节点安装mysql
  •   所有节点的时间必须同步(ntp服务器或其他方法)
  •   修改所有节点的内核参数
      i. echo 0 > /proc/sys/vm/swappiness
      ii.echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag
  四、正式开始安装
  1、cloudera manager默认的目录是在/opt下,解压到/opt目录下。
# tar xf cloudera-manager-el6-cm5.3.3_x86_64.tar.gz -C /opt/  
# ls /opt/
  
cloudera  cm-5.3.3
  
#
  
# 安装mysql-connector-java
  
# yum -y install mysql-connector-java
  2、初始化数据库
# /opt/cm-5.3.3/share/cmf/schema/scm_prepare_database.sh mysql cm -hlocalhost -uroot -p123456 --scm-host localhost scm scm scm  
# mysql -uroot -p123456 -e "show databases;"    查看下cm数据库是否创建成功
  3、复制数据到其他节点
# 修改配置文件server_host为master节点的主机名  
# grep server_host /opt/cm-5.3.3/etc/cloudera-scm-agent/config.ini
  
    server_host=master
  
# scp -rp /opt/cm-5.3.3 slave1:/opt/
  
# scp -rp /opt/cm-5.3.3 slave2:/opt/
  
#
  
# 每个节点创建系统用户
  
# useradd --system --home=/opt/cm-5.3.3/run/cloudera-scm-server --no-create-home --shell=/bin/false --comment "cloudera scm user" cloudera-scm
  4、数据库的配置
# hive  
# create database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
  
# active monitor
  
# create database amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
  
# 授权master主机
  
# grant all on *.* to 'root'@'master' identified by 'PASSWD';
  5、准备parcels安装包到/opt/cloudera/parcel-repo/
# ls /opt/cloudera/parcel-repo/  
CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel  CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha  manifest.json
  
# 注意:CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha下载后的文件重命名的
  
#
  
# 启动master节点的server和agent脚本
  
# /opt/cm-5.3.3/etc/init.d/cloudera-scm-agent start
  
# /opt/cm-5.3.3/etc/init.d/cloudera-scm-server start
  
# server端口启动较慢
  
#
  
# 启动其他所有节点的agent脚本
  
# /opt/cm-5.3.3/etc/init.d/cloudera-scm-agent start
  五、CDH 5安装配置
  1、访问http://master-ip:7180端口开始安装
DSC0000.jpg

  登陆名:admin 密码:admin
  2、选择一个版本进行安装,此处选择第一个免费版。然后下一步-->下一步
DSC0001.jpg

  3、选中所有主机:
DSC0002.jpg

  5、然后继续下一步,由于我们已经下载了离线包,所以下载是很快就能完成的
DSC0003.jpg

  6、主机检测,检测主机是否符合安装要求,符合要求后会全部通过,否则请按照要求设置
DSC0004.jpg

  7、然后选择需要安装的软件包,可以全选或自定义,也可以选择集成了某一个组件功能的软件包来安装
DSC0005.jpg

  8、角色分配,此处默认,可以按需调整
DSC0006.jpg

  9、数据库测试:
DSC0007.jpg

  10、审核更改参数,可以使用默认,也可以按需更改
DSC0008.jpg

  11、启动正常的安装配置了,等待安装完成后再次访问主页即可。
DSC0009.jpg

  12、完成后的登陆界面
DSC00010.jpg

  由于主机性能较低,数据延迟很大,查询经常无法显示。而且由于此处的磁盘空间不足,所以有很多警告信息。到此安装已全部完成。
  六、其他问题说明
  oozie的web界面的开启:
DSC00011.jpg

  cloudera的文档中有说明配置oozie:
DSC00012.jpg

  安装这个操作即可:
# mv ext-2.2.zip /var/lib/oozie/  
# cd /var/lib/oozie
  
# unzip ext-2.2.zip
  刷新界面:
DSC00013.jpg

  hadoop2.x版本更新了一些新功能,支持HDFS的高可用等。cloudera manager管理界面可以直接操作等这一系列的功能,还是很方便的。
  在集群里的HDFS界面的右上角有操作选项栏:
DSC00014.jpg

  点击后根据提示就能正常的配置了。管理界面添加移除集群中的主机也是非常方便的,具体的操作就不一一演示了。
  七、Hadoop测试程序
# 计算pi值  
# sudo -u hdfs hadoop jar /opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar pi 10 100
  
...
  
Job Finished in 126.439 seconds
  
Estimated value of Pi is 3.14800000000000000000
  
# 可以看到执行结果
  可以在YARN的web界面看到详细job的信息
DSC00015.jpg

  还有很多测试程序可以运行测试。这里就不一一演示了。
  另外,这种安装方式虽然快捷方便,但是不利于对整体的理解,建议还是使用下载安装包的方式安装,配置文件等都是需要手动编写的,对于理解比较深刻。



运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-628377-1-1.html 上篇帖子: CDH5离线安装(最新版5.3.3内置hadoop2.5.0) 下篇帖子: Hadoop运维记录系列(十五)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表