设为首页 收藏本站
查看: 951|回复: 0

[经验分享] Hadoop--4.Hadoop安装配置

[复制链接]

尚未签到

发表于 2018-10-29 11:01:11 | 显示全部楼层 |阅读模式
  一、下载
  1.下载hadoop
  [root@master ~]# cd /usr/local/src/
  [root@master src]#  wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.7.2/hadoop-2.7.2.tar.gz
  2.官网下载地址(可获最新)
  http://hadoop.apache.org/releases.html#Download
  二.安装
  1.解压
  [root@master src]# tar zxvf hadoop-2.7.2.tar.gz
  2.移动
  [root@master src]# mv hadoop-2.7.2 /usr/local/
  3.向所有slave拷贝
  [root@master src]# rsync -av /usr/local/hadoop  slave1:/usr/local/
  [root@master src]# rsync -av /usr/local/hadoop  slave2:/usr/local/
  [root@master src]# rsync -av /usr/local/hadoop  slave3:/usr/local/
  [root@master src]# rsync -av /usr/local/hadoop  slave4:/usr/local/
  [root@master src]# rsync -av /usr/local/hadoop  slave5:/usr/local/
  [root@master src]# rsync -av /usr/local/hadoop  slave6:/usr/local/
  三、配置
  1.创建目录
  [root@master ~]# mkdir -p /data/hadoop
  [root@master ~]# cd !$ && mkdir tmp dfs dfs/data dfs/name
  在所有slave完成相同操作。
  2.配置core-site.xml文件
  [root@master hadoop]# vim /usr/local/hadoop/etc/hadoop/core-site.xml
  添加以下内容:
  
  fs.defaultFS
  hdfs://192.168.0.194:9000
  
  
  hadoop.tmp.dir
  file:/data/hadoop/tmp/
  
  
  io.file.buffer.size
  131702
  
  
  注意:
  ①hdfs后面的IP是master的ip
  ②file后面跟的路径是创建tmp目录路径
  3.配置hdfs-site.xml文件
  [root@master hadoop]# vim /usr/local/hadoop/etc/hadoop/hdfs-site.xml
  添加以下内容:
  
  dfs.namenode.name.dir
  file:/data/hadoop/dfs/name
  
  
  dfs.datanode.data.dir
  file:/data/hadoop/dfs/data
  
  
  dfs.replication
  2
  
  
  dfs.namenode.secondary.http-address
  192.168.0.194:9001
  
  
  dfs.webhdfs.enabled
  true
  
  
  4.配置mapred-site.xml文件
  [root@master hadoop]# cp /usr/local/hadoop/etc/hadoop/mapred-site.xmll.template /usr/local/hadoop/etc/hadoop/mapred-site.xml
  [root@master hadoop]# vim /usr/local/hadoop/etc/hadoop/mapred-site.xml
  添加以下内容:
  
  mapreduce.framework.name
  yarn
  
  
  mapreduce.jobhistory.address
  192.168.0.194:10020
  
  
  mapreduce.jobhistory.webapp.address
  192.168.0.194:19888
  
  
  5.配置yarn-site.xml文件
  [root@master hadoop]# vim /usr/local/hadoop/etc/hadoop/yarn-site.xml
  添加以下内容:
  
  yarn.nodemanager.aux-services
  mapreduce_shuffle
  
  
  yarn.nodemanager.auxservices.mapreduce.shuffle.class
  org.apache.hadoop.mapred.ShuffleHandler
  
  
  yarn.resourcemanager.address
  192.168.0.194:8032
  
  
  yarn.resourcemanager.scheduler.address
  192.168.0.194:8030
  
  
  yarn.resourcemanager.resource-tracker.address
  192.168.0.194:8031
  
  
  yarn.resourcemanager.admin.address
  192.168.0.194:8033
  
  
  yarn.resourcemanager.webapp.address
  192.168.0.194:8088
  
  
  yarn.nodemanager.resource.memory-mb
  2048
  
  
  注意:
  2048表示设置内存大小,建议2G以上,否则在分析是就可卡死界面。
  6.修改配置hadoop-env.sh文件
  [root@master hadoop]# vim /usr/local/hadoop/etc/hadoop/hadoop-env.sh
  修改以下内容:
将:export JAVA_HOME=${JAVA_HOME}  改为:export JAVA_HOME=/usr/local/jdk1.7.0_79
  7.修改配置yarn-env.sh文件
  [root@master hadoop]# vim /usr/local/hadoop/etc/hadoop/yarn-env.sh
  在第一if前添加以下内容:
export JAVA_HOME=/usr/local/jdk1.7.0_79  8.修改配置slaves文件
  [root@master hadoop]# vim /usr/local/hadoop/etc/hadoop/slaves
  将所有slave的IP添加进入,例如:
192.168.0.2  192.168.0.3
  ........
  9.同步配置文件
  [root@master hadoop]# rsync -av /usr/local/hadoop/etc/ slave1:/usr/local/hadoop/etc
  [root@master hadoop]# rsync -av /usr/local/hadoop/etc/ slave2:/usr/local/hadoop/etc
  [root@master hadoop]# rsync -av /usr/local/hadoop/etc/ slave3:/usr/local/hadoop/etc
  [root@master hadoop]# rsync -av /usr/local/hadoop/etc/ slave4:/usr/local/hadoop/etc
  [root@master hadoop]# rsync -av /usr/local/hadoop/etc/ slave5:/usr/local/hadoop/etc
  [root@master hadoop]# rsync -av /usr/local/hadoop/etc/ slave6:/usr/local/hadoop/etc
  四、启动服务
  1.初始化
  [root@master hadoop]# /usr/local/hadoop/bin/hdfs namenode -format
  [root@master hadoop]# echo $?
  0
  注意:0表示无任何错误,如果大于0的自然数,说明初始化错误,看输出内容解决问题。
  2.启动服务(yarn)
  [root@master hadoop]# /usr/local/hadoop/sbin/start-yarn.sh
  starting yarn daemons
  starting resourcemanager, logging to /usr/local/hadoop/logs/yarn-root-resourcemanager-master.out
  192.168.0.175: starting nodemanager, logging to /usr/local/hadoop/logs/yarn-root-nodemanager-slave1.out
  192.168.0.191: starting nodemanager, logging to /usr/local/hadoop/logs/yarn-root-nodemanager-slave6.out
  192.168.0.176: starting nodemanager, logging to /usr/local/hadoop/logs/yarn-root-nodemanager-slave2.out
  192.168.0.184: starting nodemanager, logging to /usr/local/hadoop/logs/yarn-root-nodemanager-slave5.out
  192.168.0.178: starting nodemanager, logging to /usr/local/hadoop/logs/yarn-root-nodemanager-slave3.out
  192.168.0.183: starting nodemanager, logging to /usr/local/hadoop/logs/yarn-root-nodemanager-slave4.out
  注意:2.7.1的版本启动服务使用的脚本是start-all.sh(2.7.2已经弃用了)
  3.停止服务(yarn)
  [root@master hadoop]# /usr/local/hadoop/sbin/stop-yarn.sh
  4.启动服务(hdfs)
  [root@master ~]# /usr/local/hadoop/sbin/start-dfs.sh
  5.停止服务(hdfs)
  [root@master ~]# /usr/local/hadoop/sbin/stop-dfs.sh
  6.slave上查看是否启动hadoop
  [root@slave1 ~]# ps  aux |grep java
  [root@slave1 ~]# netstat -nlp |grep java  如果没有yum -y install net-tools
  5.浏览器访问
  http://192.168.0.194:8088
  http://192.168.0.194:50070
  五、测试
  1.创建目录
  [root@master ~]# cd /usr/local/hadoop/
  [root@master hadoop]# bin/hdfs dfs -mkdir /123
  2.查看目录
  [root@master hadoop]# bin/hdfs dfs -ls  /
  3.拷贝测试文件
  [root@master hadoop]# bin/hdfs dfs -copyFromLocal ./LICENSE.txt  /123
  4.分析文件(统计文件多个少单词)
  [root@master hadoop]# bin/hadoop  jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /123/LICENSE.txt /111/123
  /111/123:表示分析结果存放的目录
  jar:表示使用什么类型文件
  2.7.2.jar:表示具体使用的文件,这个最好TAB补全,不同的版本名称不一样。
  5.查看分析结果
  [root@master hadoop]# bin/hdfs dfs -cat /111/123/part-r-00000
  6.删除目录
  [root@master hadoop]# bin/hdfs dfs  -rm -r   /123
  六、扩展内容
  1.启停单个节点(hdfs)
  启动Namenode:
$HADOOP_PREFIX/sbin/hadoop-daemon.sh --config $HADOOP_CONF_DIR --script hdfs start namenode  停止Namenode:
$HADOOP_PREFIX/sbin/hadoop-daemon.sh --config $HADOOP_CONF_DIR --script hdfs stop namenode  启动Datanode:
$HADOOP_PREFIX/sbin/hadoop-daemons.sh --config $HADOOP_CONF_DIR --script hdfs start datanode  停止Datanode:
HADOOP_PREFIX/sbin/hadoop-daemons.sh --config $HADOOP_CONF_DIR --script hdfs stop datanode  2.启停单个节点(yarn)
  启动ResourceManager:
$HADOOP_YARN_HOME/sbin/yarn-daemon.sh --config $HADOOP_CONF_DIR start resourcemanager  停止ResourceManager:
$HADOOP_YARN_HOME/sbin/yarn-daemon.sh --config $HADOOP_CONF_DIR stop resourcemanager  启动NodeManager:
$HADOOP_YARN_HOME/sbin/yarn-daemons.sh --config $HADOOP_CONF_DIR start nodemanager  停止NodeManager:
$HADOOP_YARN_HOME/sbin/yarn-daemons.sh --config $HADOOP_CONF_DIR stop nodemanager  启动WebAppProxy:
$HADOOP_YARN_HOME/sbin/yarn-daemon.sh --config $HADOOP_CONF_DIR start proxyserver  停止WebAppProxy:
$HADOOP_YARN_HOME/sbin/yarn-daemon.sh --config $HADOOP_CONF_DIR stop proxyserver  3.参考文献
  官网2.7.2文档网址:http://hadoop.apache.org/docs/stable/


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-627916-1-1.html 上篇帖子: Hadoop--3.JDK1.7安装配置 下篇帖子: Hadoop--1.环境准备
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表