设为首页 收藏本站
查看: 496|回复: 0

[经验分享] hadoop 1.2.1 虚拟机centOS 安装过程(分布式)

[复制链接]

尚未签到

发表于 2016-5-13 10:24:24 | 显示全部楼层 |阅读模式
  之前写过一篇hadoop 伪分布式模式 , 主要用于学习之用 , 毕竟这个技术要真正的落实到工作上,很多配置不亲手写下, 很难消化过来, 今天特意搭建一下, 并写下来作以后查看;
  
  说下搭建的环境 (3台机器, 1台 master, 2 台slaver): 
  1. centos 5.8 64位 ; 
  2. hadoop 版本 : 1.2.1 , 目前hadoop1中最新且毕竟稳定的
  3. jdk : 1.6 , 必须64位的
  
  因前面写过一篇伪分布式,这里主要详细说下不同的地方:
  下面的操作只需要在其中一台机子操作, 然后直接拷贝整个虚拟机,作为其他2台
  1. 安装centos系统到虚拟机 ,  root 用户下 配置IP地址, hostname , DNS域名绑定 , 关闭防火墙(因对这块暂时不了解,先全部关闭) , 这些基本操作和伪分布式是一样的;
  2. 安装jdk , 配置环境变量 , 同样参考其他;
  3. 安装hadoop(普通用户) , 这里有个注意的地方, 就是你要以什么用户角色去操作hadoop , 是以普通用户还是root用户, 在实际的工作中 , root账户账号只有管理人员才会有,其他都是使用普通用户去搭建环境 , 这样可以保证系统的管理和安全性 , 下面我都是以普通用户的角色去操作hadoop , 当然你要用root用户也行 , 这样就不用管什么权限的问题:
  3.1 解压hadoop到用户的home目录下,比如我的是/home/hadoop , 这里不能解压到其他地方,因为其他普通用户没有权限去写或执行 , 只有读的权限 , 不是后面启动会报错;
  3.2 现在的目录是/home/hadoop/hadoop1.2.1 , 可以重名名一下/home/hadoop/hadoop, OK之后配置hadoop的环境变量, 这里需要切换到root下才能修改/etc/profile , 完后source 文件;
  3.3 hadoop配置文件修改: 这里的配置和伪分布基本一样,修改一个文件hdfs-site.xml
1. hadoop-env.sh
2. core-site.xml
3. hdfs-site.xml
    修改其dfs.replication 的value为2 即可, 因为有2个副本
4. mapred-site.xml
  
  3.4 设置master/slaver 节点:
  1. 修改master文件: 清空并加入master的主机名, 比如我是hadoop1;
  2. 修改slaver文件(salver机子可不配置): 清空并加入slaver的主机名,比如hadoop2
  hadoop3
  4. 好了, 3台机子相同的部分已经配置完毕, 现在讲虚拟机完全拷贝一个单独的虚拟机, 
  下面的操作的在3台机子都必须同时做对应的修改 (普通用户下):
  4.1 肯定先将IP地址配置好了, 加上3台机子的DNS绑定, hostname等 ;
  4.2 相互ping下3台机子是否连通 , ping IP还有主机名;
  4.3 SSH 免密码登录, 是在~/.ssh目录下:
  1. 3台机子执行ssh-keygen -t rsa , 生成公密钥;
  2. 将3台机子的密钥文件id_rsa.pub文件合并成一个文件 , 并重命名为authorized_keys , 修改其权限为700, 就是给当前用户增加执行的权限 , 不然后面启动会有提示要输入"yes/no"; 这个文件同时存在3台机子中;
  
  5. OK, 这里的全部最基本配置已经完成了,下面可以启动hadoop了
  5.1 格式化Master机子 , 只需在其执行就行 : hadoop namenode -format , 提示成功可以启动;
  5. start-all.sh , 也只需要在master执行一次即可 , 这里的启动后和伪分布式不一样,因为伪分布只有一台机子,所以 进程都在一台机子上, 真正的分布式 , master机子的进程有:NameNode , SeconderNameNode , JobTracker 3个;
  Slaver机子的进程有 : DataNode , TaskTracker 2个, 这里非常好理解的 ; 后面的hadoop命名操作就和之前一模一样了
  
  完毕了, 其实搭建过伪分布式, 真的分布式也不是很困难 , 我搭建的时候主要是遇到了权限的问题 , 困扰了一下 , 同样也增加我对linux和hadoop的理解, 有得有失 ,  上面就还有一个防火墙要了解处理 , 大家百度下应该没问题.
  
  
  
  

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-216421-1-1.html 上篇帖子: CentOS 6.4 安装伪分布式Hadoop 1.0.3 下篇帖子: CENTOS 6.0 mini系统编译安装mysql 5.5.16过程
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表