设为首页 收藏本站
查看: 1520|回复: 0

[经验分享] 搭建部署Hadoop 之Yarn-Xuenqlve的博客

[复制链接]

尚未签到

发表于 2018-10-28 14:00:32 | 显示全部楼层 |阅读模式
  Yarn 集群资源管理系统
  Yarn 角色及概念
  ·Yarn 是 Hadoop 的一个通用的资源管理系统
  · Yarn 角色
  – Resourcemanager
  – Nodemanager
  – ApplicationMaster
  – Container
  – Client
  · ResourceManager
  – 处理客户端请求
  – 启动 / 监控 ApplicationMaster
  – 监控 NodeManager
  – 资源分配与调度
  · NodeManager
  – 单个节点上的资源管理
  – 处理来自 ResourceManager 的命令
  – 处理来自 ApplicationMaster 的命令
  · Container
  – 对任务运行行环境的抽象,封装了 CPU 、内存等
  – 多维资源以及环境变量、启动命令等任务运行相关的信息资源分配与调度
  · ApplicationMaster
  – 数据切分
  – 为应用程序申请资源,并分配给内部任务
  – 任务监控与容错
  · Client
  – 用户与 YARN 交互的客户端程序
  – 提交应用程序、监控应用程序状态,杀死应用程序等
  Yarn 结构
DSC0000.jpg

  · YARN 的核心思想
  · 将 JobTracker 和 TaskTacker 进行分离,它由下面几大构成组件:
  – ResourceManager 一个全局的资源管理器
  – NodeManager 每个节点(RM)代理
  – ApplicationMaster 表示每个应用
  – 每一个 ApplicationMaster 有多个 Container 在NodeManager 上运行
  系统规划
  主机                                      角色                                    软件
  192.168.4.1    master       Resource Manager         YARN
  192.168.4.2    node1        Node Manager                YARN
  192.168.4.3    node2        Node Manager                YARN
  192.168.4.4    node3        Node Manager                YARN
  Yarn 安装与配置
  具体实验准备 可以参考 http://blog.51cto.com/13558754/2066708
  # ssh 192.168.4.1
  # cd /usr/local/hadoop/
  # cd etc/hadoop/
  # cp mapred-site.xml.template mapred-site.xml
  # vim mapred-site.xml
  
  
  mapreduce.framework.name
  yarn                        // 配置使用yarn 资源管理系统
  
  
  # vim yarn-site.xml
  
  
  yarn.resourcemanager.hostname
  master                //配置 Resource Manager 角色
  
  
  yarn.nodemanager.aux-services
  mapreduce_shuffle            // 一个 java 的类 真实环境与开发人员沟通
  
  
  配置完成以后
  # for i in node{1..3}                    //将配置文件同步到所有主机
  > do
  > rsync -azSH --delete /usr/local/hadoop/etc/hadoop/ ${i}:/usr/local/hadoop/etc/hadoop -e 'ssh'
  > done
  # cd /usr/local/hadoop/
  启动 yarn 服务
  # ./sbin/start-yarn.sh
  在所有主机上执行 jps, 查看是否启动成功
  # for i in master node{1..3}
  > do
  > echo ${i}
  > ssh ${i} "jps"
  > done
  master
  3312 Jps
  3005 ResourceManager
  node1
  3284 Jps
  3162 NodeManager
  node2
  2882 NodeManager
  3004 Jps
  node3
  2961 Jps
  2831 NodeManager
  显示所有可用的计算节点
  # ./bin/yarn node -list
  18/01/31 06:41:56 INFO client.RMProxy: Connecting to ResourceManager at master/192.168.4.1:8032
  Total Nodes:3
  Node-Id     Node-StateNode-Http-AddressNumber-of-Running-Containers
  node3:46007        RUNNING       node3:8042                           0
  node2:54895        RUNNING       node2:8042                           0
  node1:51087        RUNNING       node1:8042
  resourcemanager
DSC0001.jpg

  nodemangager
DSC0002.jpg

  验证 Yarn
  # bin/hadoop fs -ls /input
  Found 3 items
  -rw-r--r--   2 root supergroup      84854 2018-01-29 21:37 /input/LICENSE.txt
  -rw-r--r--   2 root supergroup      14978 2018-01-29 21:37 /input/NOTICE.txt
  -rw-r--r--   2 root supergroup       1366 2018-01-29 21:37 /input/README.txt
  使用yarn 统计 样本文件中单词出现频率
  # ./bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount hdfs://master:9000/input  hdfs://master:9000/output
  查看结果
  # ./bin/hadoop fs -cat hdfs://master:9000/output/*
  Yarn 节点管理
  [root@master ~] # cat /etc/hosts
  192.168.4.1master
  192.168.4.2 node1
  192.168.4.3 node2
  192.168.4.4 node3
  192.168.4.5 newnode
  [root@newnode ~]# rsync -azSH --delete master:/usr/local/hadoop /usr/local
  [root@master hadoop]# ./sbin/start-yarn.sh
  添加节点
  [root@master hadoop]# ./bin/yarn node -list
  18/01/28 21:06:57 INFO client.RMProxy: Connecting to ResourceManager at master/192.168.4.1:8032
  Total Nodes:3
  Node-Id     Node-StateNode-Http-AddressNumber-of-Running-Containers
  node1:33596        RUNNING       node1:8042                           0
  node2:53475        RUNNING       node2:8042                           0
  node3:34736        RUNNING       node3:8042                           0
  [root@newnode hadoop]# sbin/yarn-daemon.sh start nodemanager
  [root@master hadoop]# ./bin/yarn node -list
  18/01/28 21:07:53 INFO client.RMProxy: Connecting to ResourceManager at master/192.168.4.1:8032
  Total Nodes:4
  Node-Id     Node-StateNode-Http-AddressNumber-of-Running-Containers
  newnode:39690        RUNNING     newnode:8042                           0
  node1:33596        RUNNING       node1:8042                           0
  node2:53475        RUNNING       node2:8042                           0
  node3:34736        RUNNING       node3:8042                           0
  删除节点
  [root@newnode hadoop]# sbin/yarn-daemon.sh stop nodemanager
  //不会立即删除
  [root@master hadoop]# ./bin/yarn node -list
  18/01/28 21:11:31 INFO client.RMProxy: Connecting to ResourceManager at master/192.168.4.1:8032
  Total Nodes:4
  Node-Id     Node-StateNode-Http-AddressNumber-of-Running-Containers
  newnode:39690        RUNNING     newnode:8042                           0
  node1:33596        RUNNING       node1:8042                           0
  node2:53475        RUNNING       node2:8042                           0
  node3:34736        RUNNING       node3:8042                           0
  //需要重新启动服务
  [root@master hadoop]# ./sbin/stop-yarn.sh
  [root@master hadoop]# ./sbin/start-yarn.sh
  [root@master hadoop]#  ./bin/yarn node -list
  18/01/28 21:12:46 INFO client.RMProxy: Connecting to ResourceManager at master/192.168.4.1:8032
  Total Nodes:3
  Node-Id     Node-StateNode-Http-AddressNumber-of-Running-Containers
  node1:42010        RUNNING       node1:8042                           0
  node2:55043        RUNNING       node2:8042                           0
  node3:38256        RUNNING       node3:8042                           0


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-627565-1-1.html 上篇帖子: 大数据测试之hadoop单机环境搭建(超级详细版) 下篇帖子: hadoop mapreduce开发实践之HDFS压缩文件(-cacheArchive)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表