设为首页 收藏本站
查看: 776|回复: 0

[经验分享] Hadoop:The Definitive Guid 总结 Chapter 9 构建MapReduce集群

[复制链接]

尚未签到

发表于 2015-7-13 10:59:26 | 显示全部楼层 |阅读模式
  1.集群规范
  1)配置规范
  一般Hadoop DataNode和TaskTracker节点典型机器具有吐下规范:


  • 处理器:2个四核 2~2.5 GHz CPU
  • 内存:16~24 ECC RAM
  • 存储器:4*1TB SATA 磁盘
  • 网络:千兆以太网
  2).网络拓扑
  Hadoop集群架构包含两级网络拓扑,如下图所示,机架拓扑由两个网络位置描述,例如:/交换机1/机架1 和 /交换机1/机架2。这个架构的一突出特点是:同一机架内部节点间的总宽带要远高于不同机架间的节点的宽带
  
  
  2.集群的构建原装、SSH配置、Hadoop配置
  这里只给出Yarn的典型伪分布配置 分布式配置与此差别不大 详见http://hadoop.apache.org/ 里面的配置安装文档较比权威指南的要更加权威和准确
  core.xml







fs.defaultFS
hdfs://localhost:8020


  
  hdfs.xml







dfs.replication
1


dfs.namenode.name.dir
/home/yourname/Hadoop/hadoop-0.23.1/dfs/name


dfs.datanode.data.dir
/home/yourname/Hadoop/hadoop-0.23.1/dfs/data


dfs.federation.nameservices
ns1


dfs.namenode.rpc-address.ns1
localhost:8020


dfs.namenode.http-address.ns1
localhost:23004


dfs.namenode.secondary.http-address.ns1
localhost:23005


  
  mapred.xml







mapreduce.framework.name
yarn


mapreduce.cluster.temp.dir
/home/yourname/Hadoop/hadoop-0.23.1/mapred/temp


mapreduce.cluster.local.dir
/home/yourname/Hadoop/hadoop-0.23.1/mapred/local


  
  yarn-site.xml







yarn.nodemanager.aux-services
mapreduce.shuffle


yarn.nodemanager.aux-services.mapreduce.shuffle.class
org.apache.hadoop.mapred.ShuffleHandler


yarn.resourcemanager.address
localhost:8042


yarn.resourcemanager.scheduler.address
localhost:8032


yarn.resourcemanager.webapp.address
localhost:18089


yarn.resourcemanager.resource-tracker.address
localhost:8027


yarn.nodemanager.resource.memory-mb
4096


yarn.resourcemanager.admin.address
localhost:8143


  

  3.安全性
  Kerberos实现了用户验证,它的职责在于鉴定登陆账号是否是他所声称的用户,Hadoop则决定这个用户到底有多少权限。
  使用Kerberos时,客户端要经过三个步骤来获取服务:
  1).认证      
  2).授权  
  3).服务请求
  如下图:
DSC0000.jpg
  另外还有一种认证方法--委托令牌,它有服务器创建(NameNode),可以视为客户端和服务器之间共享的密文
  
  4.利用基准测试程序测试Hadoop集群
  1).使用TestDFSIO来测试HDFS
  TestDFSIO能够用于测试HDFS的I/O性能,它用一个MapReduce作业并行地读或写作业
  2).使用Sort程序测试MapReduce
  整个测试含三个步骤:随机才生一些数据,排序操作,验证结果。
  
  5.云端Hadoop
  主要举例在Amazon EC2上的Hadoop  详见相关资料

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-86248-1-1.html 上篇帖子: Hadoop 的常用组件一览 下篇帖子: hadoop高可用性部署
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表