设为首页 收藏本站
查看: 832|回复: 0

[经验分享] hadoop学习第一天

[复制链接]

尚未签到

发表于 2017-12-17 21:03:29 | 显示全部楼层 |阅读模式


一、虚拟机环境搭建
  我们用的虚拟机为vmware,Linux镜像为centOS6.5.
  vmware安装
  安装没什么多说的,一路下一步,但是在新建虚拟机的时候有两个地方需要注意:
  1.分配处理器1个就好了,毕竟现在搭的是伪分布式
  2.内存分配多一些,这个就看自己机器的情况了
  3.网络设置为NAT,不然会有连不上网的问题
  centOS6.5安装
  将镜像文件添加至虚拟机中,这个CentOS6.5安装比较傻瓜式,不用自己操作,不像之前在CentOS7的安装,还需要自己进行分区,各种设置。
  CentOS6.5配置网络环境
  1.进入Linux,右击网络->edit connection->双击你的网卡进行ip配置
  ipv4setting->manual->add->address network gateway分别为虚拟机上面的编辑->虚拟网络编辑器->第二个NAT模式中的各种网络配置
  我的网络为192.168.32.100 255.255.255.0 192.168.32.2
  2.命令行输入ifconfig,查看当前虚拟机的IP,若IP为192.168.32.100则配置正确
  3.将给好的jdk-8u121-linux-x64.tar.gz包和hadoop-2.6.0.tar.gz包上传至~/hadoop/(/home/qjx/hadoop/)目录下面
  4.修改主机名称(root)vim /etc/sysconfig/network 修改HOSTNAME为当前用户名qjx,重启后生效
  5.重启后关闭防火墙(root)vim /etc/init.d/iptables stop
  当前linux环境配置如下:
  用户:qjx 123456
  IP:192.168.32.100
  主机名:qjx

二、JDK安装
  1.进入hadoop目录
  

cd hadoop/  

  2.将hadoop/目录下的jdk-8u121-linux-x64.tar.gz解压
  

tar -zxvf jdk-linux.tar.gzjdk-8u121-linux-x64.tar.gz  

  3.编辑/etc/profile文件,并在最后将jdk配置到path(root)
  

vim /etc/profile  

  
JAVA_HOME=/home/qjx/hadoop/jdk1.8.0_121
  

  
export PATH=$PATH:$JAVA_HOME/bin
  

  使更改生效(qjx)
  

source /etc/profile  

  检验path是否正确可以在命令行输入echo $PATH

三、hadoop安装和伪分布式基本配置
  1.进入hadoop/目录
  

cd hadoop/  

  2.解压hadoop/目录下的hadoop-2.6.0.tar.gz,完成后会在当前hadoop目录下有hadopp-2.6.0目录
  

tar -zxvf hadoop-2..6.0.tar.gz  

  3.修改hadoop-2.6.0/etc/hadoop/hadoop-env.sh文件,增加一行
  

export JAVA_HOME=/home/qjx/hadoop/jdk-1.8.0_121  

  4.修改配置文件hadoop-2.6.0/etc/hadoop/core-site.xml,在configaration标签中添加配置
  

<property>  
   <name>fs.defaultFS</name>
  
   <value>hdfs://qjx:9000</value>
  
</property>
  

  ps:此文件配置了hdfs的访问路径,qjx即为自己主机名
  5.修改配置文件hadoop-2.6.0/etc/hadoop/hdfs-site.xml,添加配置标签
  

<property>  
  <name>dfs.replication</name>
  
  <value>1</value>
  
</property>
  

  ps:此文件配置了hdfs节点的副本数(block),因为是单节点伪分布式,所以只需要一个
  6.修改配置文件hadoop-2.6.0/etc/hadoop/mapred-site.xml ,这个文件不存在,需要复制一份tmp
  

cp hadoop-2.6.0/etc/hadoop/mapred-site.xml.template hadoop-2.6.0/etc/hadoop/mapred-site.xml  

  添加配置
  

<property>  
  <name>mapreduce.framework.name</name>
  
  <value>yarn</value>
  
</property>
  

  7.修改配置文件hadoop-2.6.0/etc/hadoop/yarn-site.xml 
  

<property>  
   <name>yarn.nodemanager.aux-services</name>
  
   <value>mapreduce_shuffle</value>
  
</property>
  

  到此为止,配置文件已经修改完成

四、格式化hdfs和启动伪分布式集群
  1.修改/etc/hosts文件(root),添加 一行 主机IP 主机名
  

192.168.32.100  qjx  

  2.格式化HDFS,在hadoop解压目录下(/home/qjx/hadoop/hadoop-2.6.0/),执行如下命令:
  

bin/hdfs namenode -format  

  注意:格式化只能操作一次,如果因为某种原因,集群不能用, 需要再次格式化,需要把上一次格式化的信息删除,在/tmp目录里执行 rm –rf *(默认将namenode存在/tmp/中,如果后续有操作将配置文件hdfs-site.xml的namenode的值改为了自定义的路径,则删除自己定义的目录)
  3.启动集群,在hadoop解压目录下,执行如下命令:
  

sbin/start-all.sh   

  需要输入四次当前用户的密码,如果想要不输入密码,可通过配置ssh互信解决,下面有详细方法
  4.启动后,命令行输入jps,检查有以下的输出:
  

[qjx@qjx hadoop-2.6.0]$ jps  

  
    32033 Jps
  

  
    31718 SecondaryNameNode
  

  
    31528 DataNode
  

  
    31852 ResourceManager
  

  
    31437 NameNode
  

  
    31949 NodeManager
  

  ps:如果碰到缺少某一项,则去hadoop-2.6.0/logs/下面找相应缺少的文件log日志中的错误去解决
  5.关闭集群命令:  
  

sbin/stop-all.sh  

  同样需要输入四次密码

五、ssh互信配置(rsa加密方法)
  互信,顾名思义,互相信任,即将两个主机通过公钥,私钥添加互相信任,配置完成可以不用输入密码即可连接ssh
  1.命令行输入:ssh-keygen 后,一直Enter,完事(会在根目录下生成三个文件id_rsa,id_rsa.pub,known_hosts)
  2.把公钥给信任的主机(本机)
  命令行输入 ssh-copy-id 主机名 
  

ssh-copy-id qjx  

  这个过程需要输入信任主机的密码
  3.验证是否成功,在命令行输入 ssh 信任主机名称
  

ssh qjx  

  若无提示输入密码,则配置成功

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-425152-1-1.html 上篇帖子: hadoop环境搭建(linux单机版) 下篇帖子: hadoop2.x入门:Hadoop的启动方式
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表