设为首页 收藏本站
查看: 2526|回复: 0

[经验分享] 基于金山云平台的Hadoop集群部署(二)

[复制链接]

尚未签到

发表于 2017-12-17 19:44:18 | 显示全部楼层 |阅读模式
DSC0000.png   四、    建立hadoop集群需要的工作文件夹
  利用以下命令在本地建立一些列文件夹,用作hadoop集群的工作目录。
  mkdir  /root/hadoop
  mkdir  /root/hadoop/tmp
  mkdir  /root/hadoop/var
  mkdir  /root/hadoop/dfs
  mkdir  /root/hadoop/dfs/name
  mkdir  /root/hadoop/dfs/data

DSC0001.png 这些文件夹在后面对hadoop相关的配置中也会用到。  五、    配置hadoop的java工作路径
  在hadoop-2.8.0/etc/hadoop/hadoop-env.sh文件中,配置hadoop的java工作路径。

DSC0002.png 将export JAVAHOME=${JAVAHOME} 修改为: export   JAVA_HOME=(你自己的java环境工作目录)  本机的工作路径如下: /lib/jvm/java-1.8.0-openjdk-1.8.0.131-3.b12.el7_3.x86_64/jre  

DSC0003.png 配置完成后保存退出;  六、    配置core-site.xml文件
  core-site.xml文件是hadoop集群的全局控制文件。
  利用 vi  /usr/hadoop/hadoop-2.8.0/etc/Hadoop/core-site.xml命令修改相关配置,在<configuration>和</configuration>标签之内添加进如下内容:
  <property>
  <name> hadoop.tmp.dir</name>
  <value>/root/hadoop/tmp</value>
  <description>Abase for other temporary directories.</description></property>
  <property>
  <name>fs.default.name< /name>
  <value>hdfs://namenode1:9000< /value>
  </property>

DSC0004.png   七、    配置hdfs-site.xml文件
  hdfs-site.xml文件用来配置HDFS的保存副本数量、位置等存储的配置选项。
  利用 vi  /usr/hadoop/hadoop-2.8.0/etc/Hadoop/hdfs-site.xml命令修改相关配置,在<configuration>和</configuration>标签之内添加进如下内容:
  <property>
  <name>dfs.name.dir</name>
  <value>/root/hadoop/dfs/name</value>
  <description>Path on the local filesystem where theNameNode stores the namespace and transactions logs persistently.
  </description>
  </property>
  <property>
  <name>dfs.data.dir</name>
  <value>/root/hadoop/dfs/data</value>
  <description>Comma separated list of paths on the localfilesystem of a DataNode where it should store its blocks.
  </description>
  </property>
  <property>
  <name>dfs.replication</name>
  <value>2</value>
  </property>
  <property>
  <name>dfs.permissions</name>
  <value>false</value>
  <description>need not permissions</description>
  </property>

DSC0005.png   八、    配置mapred-site.xml
  mapred-site.xml文件用来配置MP运算位置及其他相关选项。
  首先利用命令cp hadoop-2.8.0/etc/hadoop/mapred-site.xml.template hadoop-2.8.0/etc/hadoop/mapred-site.xml从mapred-site.xml. template复制出一个mapred-site.xml文件。
DSC0006.png

  利用 vi  /usr/hadoop/hadoop-2.8.0/etc/Hadoop/mapred-site.xml命令修改相关配置,在<configuration>和</configuration>标签之内添加进如下内容:
  <property>
  <name>mapred.job.tracker</name>
  <value>namenode1:49001</value>
  </property>
  <property>
  <name>mapred.local.dir</name>
  <value>/root/hadoop/var</value>
  </property>
  <property>
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
  </property>

DSC0007.png   九、    配置slaves文件
  利用 vi  /usr/hadoop/hadoop-2.8.0/etc/Hadoop/slaves命令修改相关配置,将localhost修改为如下内容:

DSC0008.png   配置完后,整个集群即认为datanode为slaves节点。
  十、    配置yarn-site.xml文件
  yarn-site.xml文件用来配置hadoop的资源管理和任务调度。
  利用 vi  /usr/hadoop/hadoop-2.8.0/etc/Hadoop/mapred-site.xml命令修改相关配置,在<configuration>和</configuration>标签之内添加进如下内容:
  <property>
  <name>yarn.resourcemanager.hostname</name>
  <value>namenode1
  </property>
  <property>
  <description>The address of the applications manager interface in the RM.</description>
  <name>yarn.resourcemanager.address</name>
  <value>${yarn.resourcemanager.hostname}:8032</value>
  </property>
  <property>
  <description>The address of the scheduler interface.</description>
  <name>yarn.resourcemanager.scheduler.address</name>
  <value>${yarn.resourcemanager.hostname}:8030</value>
  </property>
  <property>
  <description>The http address of the RM web application.</description>
  <name>yarn.resourcemanager.webapp.address</name>
  <value>${yarn.resourcemanager.hostname}:8088</value>
  </property>
  <property>
  <description>The https adddress of the RM web application.</description>
  <name>yarn.resourcemanager.webapp.https.address</name>
  <value>${yarn.resourcemanager.hostname}:8090</value>
  </property>
  <property>
  <name>yarn.resourcemanager.resource-tracker.address</name>
  <value>${yarn.resourcemanager.hostname}:8031</value>
  </property>
  <property>
  <description>The address of the RM admin interface.</description>
  <name>yarn.resourcemanager.admin.address</name>
  <value>${yarn.resourcemanager.hostname}:8033</value>
  </property>
  <property>
  <name>yarn.nodemanager.aux-services</name>
  <value>mapreduce_shuffle</value>
  </property>
  <property>
  <name>yarn.scheduler.maximum-allocation-mb</name>
  <value>2048< /value>
  <discription>每个节点可用内存,单位MB</discription>
  </property>
  <property>
  <name>yarn.nodemanager.vmem-pmem-ratio</name>
  <value>2.1</value>
  </property>
  <property>
  <name>yarn.nodemanager.resource.memory-mb</name>
  <value>2048</value>
  </property>
  <property>
  <name>yarn.nodemanager.vmem-check-enabled</name>
  <value>false</value>
  </property>
DSC0009.png

  十一、    在每一个节点上(包含namenode与datanode)做相同的配置
  十二、    配置Hadoop集群
  12.1    初始化集群
  切换到namenode节点,进入hadoop-2.8.0目录,利用bin/hadoop  namenode -format命令初始化hadoop集群:

DSC00010.png   成功后可以在看到在/root/hadoop/dfs/name/目录多了一个current目录,而且该目录内已经存放了一些配置文件则表示初始化成功:

DSC00011.png   12.2    启动集群
  利用sbin/ start-dfs.sh启动HDFS服务,利用sbin/ start-yarn.sh启动yarn服务。
  十三、    利用hadoop自带示例测试集群
  13.1    本地建立文件夹
  利用mkdir input命令在/usr/hadoop文件夹内建立本地input文件夹:

DSC00012.png   13.2    文件夹中放入要上传到hadoop的文件
  在input文件夹内创建2个文件,本示例为test1.txt和test2.txt,在文件中随便输入一些字符:

DSC00013.png   13.3    上传文件到hadoop集群
  利用bin/hadoopfs -mkdir  /root及bin/hadoop fs -mkdir  /root/in命令与bin/hadoop fs -mkdir /root/out命令,在hadoop集群上创建/root/in与root/out文件夹;其中/root/in文件夹是用作集群上保存文件的位置,而/root/out文件夹是用作集群输出结果保存的位置;
  利用bin/hadoopfs -put /usr/hadoop/input/  /root/in/;将本地的input文件夹及内容上传到集群的/root/in/文件夹中,成功后可以利用bin/hadoop fs -ls /root/in/input命令查询出集群中的文件信息:

DSC00014.png   从信息中已经可以看到,test1.txt和test2.txt已经上传到集群中。
  13.4    运行wordcount示例
  利用bin/hadoopjar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.0.jar wordcount /root/in/input  /root/out/output1 命令,统计文件中各单词的个数:
DSC00015.png


DSC00016.png   如果有以上信息,则表示运行成功。
  以上为hadoop的集群搭建简单的过程,以后的系列中会继续介绍Hadoop其他组件(Spark、Hive、Pig、HUE…)的安装配置,并部署更复杂的集群,进行相关测试。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-425121-1-1.html 上篇帖子: hadoop HDFS常用文件操作命令 下篇帖子: Hadoop伪分布安装详解(五)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表