设为首页 收藏本站
查看: 713|回复: 0

[经验分享] Hadoop学习--伪分布式部署--day01

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2017-1-4 09:58:16 | 显示全部楼层 |阅读模式
                      1.伪分布式安装准备工作
   上传hadoop-2.7.3.tar.gz  /soft
   虚拟机Java安装完毕
        卸载原有的openjdk的版本
        # java -version如果看到有openjdk的字样就是说明是系统带的openjdk版本
        # rpm -qa|grep jdk
        用类似如下的方法删除上面的rpm包
           #rpm -e --nodeps   java-1.6.0-openjdk-1.6.0.0-1.66.1.13.0.el6.x86_64
        检查是否还有jdk1.5的版本,有就删除
        #rpm -e --nodeps java-1.5.0-gcj-1.5.0.0-29.1.el6.x86_64
        #解压新下载的jdk的安装包
        配置环境变量
2.解压hadoop
   $tar -xzvf hadoop-2.7.3.tar.gz
3.配置环境变量
   编辑/etc/profile,添加如下内容
   export JAVA_HOME=/soft/jdk1.8.0_111
   export HADOOP_HOME=/soft/hadoop-2.7.3
   export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
   并且把以上的内容写到/home/hadoop/.bashrc中
4.配置SSH免密码登陆
   $ssh-keygen -t rsa (四个回车)
   执行完这个命令后,会生成两个文件id_rsa(私钥)、id_rsa.pub(公钥)
   将公钥拷贝到要免登陆的机器上
   $cd /home/hadoop/.ssh
   $cat id_rsa.pub >> ~/.ssh/authorized_keys
   $chmod 600 authorized_keys  

   mkdir ./ssh
   chmod 700 ~/.ssh cd ~/.ssh
   ssh-keygen -t rsa
   cd ~/.ssh
   cat /root/.ssh/id_rsa.pub > authorized_keys
   chmod 600 ~/.ssh/authorized_keys
   scp authorized_keys userB:/root/.ssh/
   注:A 为管理主机,B为被管理主机。
5.修改core-site.xml
   添加如下信息
<configuration>
<!-- 指定HADOOP所使用的文件系统schema(URI),HDFS的老大(NameNode)的地址 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost/</value>
</property>
</configuration>
6.修改hdfs-site.xml
<!-- 指定HDFS副本的数量 -->
<property>
<name>dfs.replication</name>
<value>1</value>
</property>  
7.修改mapred-site.xml
<!-- 指定mr运行在yarn上 -->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
8.修改yarn-site.xml
<!-- 指定YARN的老大(ResourceManager)的地址 -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>localhost</value>
</property>
<!-- reducer获取数据的方式 -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
9.格式化namenode(是对namenode进行初始化
  $hdfs namenode -format (hadoop namenode -format)
10.启动hadoop
  先启动HDFS
  $start-dfs.sh
  $start-yarn.sh
  关闭的顺序最好相反
11.目录操作
  $hadoop fs -mkdir -p /user/hadoop
  $hadoop fs -ls /
  $hadoop fs -ls -R /
  $hadoop fs -lsr /
  上传
  $hadoop fs -put <linux上文件>  <hdfs上的路径>
  $hadoop fs -put local.txt /user/hadoop/xx.txt   //将本地文件put到hdfs文件系统
  查看文件内容
  $hadoop fs -cat <hdfs上的路径>
  下载文件
  $hadoop fs -get <hdfs上的路径> <linux上的文件>
12.查看帮助
  $hadoop fs  //直接回车
  $hadoop fs -help put //查看put的具体信息
13.查看namenode和datanode在本地
  $cd /tmp/hadoop-hadoop/dfs/name/...   //第一个hadoop是hadoop用户登陆启动创建的
  $cd /tmp/hadoop-hadoop/dfs/data/...
14.查看log文件
  $ $HADOOP_HOME/logs
15.通过webui查看日志或者集群情况
  http://localhost:500070/    //namenode web server port
  http://localhost:8088/      //resourceManager,只有在本机访问才可以。hadoop集群信息
  http://localhost:19888/     //historyServer
16.通过netstat查看网络端口占用情况
  $netstat  -lnpt  //l:listener  u:udp  p:program  name


                   


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-323663-1-1.html 上篇帖子: hadoop集群内存设置 下篇帖子: Hadoop学习--完全分布式部署(pdsh/include&exclude/安全模式/均衡...
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表