设为首页 收藏本站
查看: 938|回复: 0

[经验分享] Hadoop 2.0+YARN启动脚本分析与实战经验

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2014-4-18 11:50:35 | 显示全部楼层 |阅读模式
伪分布式模式下,Hadoop将所有进程运行于同一台主机上,但此时Hadoop将使用分布式文件系统,而且各jobs也是由JobTracker服务管理的独立进程。同时,由于伪分布式的Hadoop集群只有一个节点,因此HDFS的块复制将限制为单个副本,其secondary-master和slave也都将运行于本地主机。此种模式除了并非真正意义的分布式之外,其程序执行逻辑完全类似于完全分布式,因此,常用于开发人员测试程序执行。
hadoop的配置共有四种级别:集群、进程、作业和单独操作,前两类由集群管理员负责配置,后面的两类则属于程序员的工作范畴。
hadoop的配置文件位于conf目录中,其中的core-site.xml、mapred-site.xml和hdfs-site.xml三个配置文件最为关键。core-site.xml用于配置hadoop集群的特性,它作用于全部进程及客户端,mapred-site.xml配置mapreduce集群的工作属性,hdfs-site.xml配置hdfs集群的工作属性。
另外还有三个配置文件需要留意。hadoop-env.sh是Hadoop的多个脚本执行时source的配置信息,其用于为Hadoop指定运行时使用的JDK、各进程的JDK属性、PID文件及日志文件的保存目录等。masters则用于指定辅助名称节点(SecondaryNameNode)的主机名或主机地址,slaves用于指定各从服务器(TaskTracker或DataNode)的主机名或主机地址。对伪分布式的Hadoop集群来讲,这些节点均为本机。
一、JDK安装与配置
二、Hadoop安装与配置
     1、Hadoop下载与安装
    使用wget命令下载:wget http://mirrors.hust.edu.cn/apach ... hadoop-2.3.0.tar.gz
       解压缩:tar -zxvf hadoop-2.3.0.tar.gz
    重命名:mv hadoop-2.3.0 hadoop
          #vi ect/profile
          HADOOP_PREFIX=/opt/hadoop
          PATH=$HADOOP_PREFIX/bin:$PATH
          export HADOOP_PREFIX PATH
         执行环境配置:source /etc/profile
         验证:hadoop -version
     2、Hadoop配置
         Hadoop配置在hadoop/etc/hadoop下,作如下修改:
    hadoop-env.sh
         export JAVA_HOME=/usr/local/java/jdk1.7.0_51(JDK安装目录)
         修改内存大小:export HADOOP_CLIENT_OPTS="-Xmx512m $HADOOP_CLIENT_OPTS"
     core-site.xml,做如下配置:
         <configuration>
      <!--NameNode的IP地址和端口-->
          <property>
             <name>fs.defaultFS</name>
             <value>hdfs://localhost:9000</value>
          </property>
          <property>
              <name>hadoop.tmp.dir</name>
              <value>/tmp/hadoop/hadoop-${user.name}</value>
          </property>
        </configuration>
          hdfs-site.xml,做如下配置(系统默认文件保存3份,因伪分布模式,故改为1份):
          <configuration>
           <property>
              <name>dfs.replication</name>
                <value>1</value>
            </property>
      <property>
                    <name>dfs.namenode.name.dir</name>
                    <value>/hadoop/namenode</value>
              </property>
              <property>
                    <name>dfs.datanode.data.dir</name>
                    <value>/hadoop/datanode</value>
              </property>
          </configuration>
      mapred-site.xml,做如下配置:
    <configuration>
            <property>
                 <name>mapreduce.jobtracker.address</name>
                 <value>localhost:9001</value>
            </property>
         </configuration>
     hadoop2.0有了yarn所以原来的mapred配置都转向yarn-site.xml文件中了,这里也就指定yarn。
     yarn-site.xml,为方便,未进行配置。
         core-site.xml配置参考:http://hadoop.apache.org/docs/r2 ... on/core-default.xml
    hdfs-site.xml配置参考:http://hadoop.apache.org/docs/r2 ... fs/hdfs-default.xml
    mapred-site.xml配置参考:http://hadoop.apache.org/docs/r2 ... /mapred-default.xml
         yarn-site.xml配置参考:http://hadoop.apache.org/docs/r2 ... on/yarn-default.xml
         执行hadoop环境配置:source /opt/hadoop/etc/hadoop/hadoop-env.sh
   由于启动hadoop需一遍遍输入密码,不方便,故设置ssh免密登陆本机
         ssh-keygen -t rsa -P "" 输入这个命令后一直回车就可以了
         cat /root/.ssh/id_rsa.pub >> /root/.ssh/authorized_keys
         切换到安装目录
         格式化namenode:./bin/hadoop namenode –format
   启动hadoop:./sbin/start-all.sh设置ssh免密登陆本机
         检查进程是否启动:jps
         
          有以上内容说明已经启动
      hadoop资源管理页面:http://localhost:8088
    namenode节点信息:http://localhost:50070


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-17732-1-1.html 上篇帖子: hadoop三个配置文件的参数含义说明core-site.xml、hdfs-site.xml、... 下篇帖子: Hadoop 2.0+YARN启动脚本分析与实战经验
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表