设为首页 收藏本站
查看: 1038|回复: 0

[经验分享] Hadoop第一式:配置Linux环境

[复制链接]

尚未签到

发表于 2017-11-17 20:35:37 | 显示全部楼层 |阅读模式
  所有操作在虚拟机下完成,虚拟机软件选用VMware Workstation Pro 12 (后文简称为VM)
  关于Linux安装不再阐述一、网络环境配置
  1)Windows界面
  首先在VM页面,点击虚拟网络编辑器
DSC0000.png

  进入后把vmnet8改为nat模式
DSC0001.png

  次之,点击上图红框右边的NAT设置网关,前缀随意,记得数字1结尾
DSC0002.png

  然后修改子网IP,要求在网段内
DSC0003.png

  继而设置本机的vmnewt8,博主为windows10
  在网络连接设置中
DSC0004.png

  设置ipv4,双击即可
DSC0005.png

  设置与刚才虚拟机设置的ip为统一网段内
DSC0006.png

  2)Linux界面
  setup指令,进入设置伪图形界面
  选择网络设置
DSC0007.png

DSC0008.png

  选择当前虚拟网卡(当前我的系统下只有一块虚拟网卡,最多可以有8块)
DSC0009.png

  进入
DSC00010.png

  从上至下为
  网卡名字、网卡设备、是否自动获取(若自动获取DHCP中为*)、IP地址、子网掩码、默认网关、DNF服务器、备用DNS服务器
  设置完毕后退出,然后重启网关
  重启指令为  sudo service network restart
DSC00011.png

  然后cmd下测试
DSC00012.png

  成功
  网络配置到此结束
  二、软件环境配置
  由此开始不再在linux虚拟机上直接操作,使用SecureCRTPortable进行远程连接
  打开软件后点击闪电图标连接
DSC00013.png

  设置
DSC00014.png

  输入密码并保存密码
DSC00015.png

  进入成功后,在界面ALT+P  可进入SFTP界面(SSH)
  使用 put 路径(例如:put C:\jdk-7u_65-i585.tar.gz)
  可将本机软件拷贝至远程主机(linux虚拟机)
DSC00016.png

  传输完毕后删除不需要的文件夹
  rm -rf 文件夹名
  新建文件夹application
  mkdir application
  然后把jdk解压至application文件夹
  tar -zxvf jdk-7u_65-i585.tar.gz -C application/
    

    接下来配置环境变量(CentOS下 vi与vim没区别)  shift+g 到达文章最下一行,gg第一行   shift+$到达行尾
    sudo vi /etc/profile
    在文件最后添加  SecureCRTPortable左键选中是复制,右键一下就是粘贴
  export JAVA_HOME=/home/hadoop/app/jdk-7u_65-i585
  export PATH=$PATH:$JAVA_HOME/bin
  刷新配置文件
  source /etc/profile
  检测是否成功
  java -version
DSC00017.png

  jdk环境变量搞定
  下面进行Hadoop配置
  文件传输、解压方法和jdk一样
  解压到application后删除 doc 帮助文档(不删也没事,只是节省点存储空间)
  接下来修改配置文件,Hadoop的配置文件在/etc/hadoop目录下,需要修改的文件如下所示
  第一个:hadoop-env.sh
  vim hadoop-env.sh
#第27行  数字打27然后按enter键可以从文头直达27行
  #这里要写死,原本是自动读取系统变量,但有时候读不到
  #echo $JAVA_HOME   可以输出变量值
  export JAVA_HOME=/home/hadoop/app/jdk1.7.0_65
第二个:core-site.xml  <!-- 指定HADOOP所使用的文件系统schema(URI),HDFS的老大(NameNode)的地址 -->
<property>
<name>fs.defaultFS</name>
<!-- localhost为你自己的主机名称,端口号自定义,默认9000 -->
<value>hdfs://localhost:9000</value>
</property>
<!-- 指定hadoop运行时产生文件的存储目录 -->
<property>
<name>hadoop.tmp.dir</name>
<!-- 真实环境应当单独指定NameNode和DataNode的挂载点,可以拓展更多的磁盘 -->
<value>/home/hadoop/application/hadoop-2.4.1/data</value>
    </property>
  以上配置都在<configuration></configuration>中加入
第三个:hdfs-site.xml  <!-- 指定HDFS副本的数量 ,因为博主是用虚拟机,所以随便几个副本都是在一台机器上,配多个没啥意义,真实环境应该为3个或以上-->
<property>
<name>dfs.replication</name>
<value>1</value>
    </property>
<!-- 还可以指定切块大小,1.版本默认64M 2.版本默认128M -->
第四个:mapred-site.xml  mv mapred-site.xml.template mapred-site.xml
<!-- 修改文件名,否则读不到 -->
  vim mapred-site.xml
<!-- 指定mr运行在yarn上 -->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
    </property>
第五个:yarn-site.xml  <!-- 指定YARN的老大(ResourceManager)的地址 -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>localhost</value>
<!-- localhost为机器名,若改过请用改之后的 -->
    </property>
<!-- reducer获取数据的方式 -->
    <property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
     </property>
  注意:要配置DataNode的节点地址在slaves.xml里面添加
  然后先关闭防火墙
  sudo service iptables status  查看防火墙状态
  sudo service iptables stop   关闭防火墙
  因为只是当前关闭防火墙,防火墙是自启的,所以要永久关闭服务
  sudo chkconfig iptables --list  看到各级别防火墙自启状态
  sudo chkconfig iptables off   关闭自启防火墙
  可以一个个端口号往防火墙白名单里添加,但Hadoop一般是在内网跑,干脆直接关闭,懒得麻烦了
  现在配置下环境变量 
  sudo vi /etc/proflie
  最下面加2行
  export HADOOP_HOME=/home/hadoop/app/hadoop-2.4.1
  export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
  配置完成后格式化Hadoop
  记得刷新 source /etc/profile
  hadoop namenode -format
DSC00018.png

  搞定
  现在准备启动Hadoop,进入Hadoop的sbin文件夹,可以看见很多的启动指(.sh结尾的)
  启动
  start-dfs.sh
   start-yarn.sh
    jps查看进程
   DSC00019.png
  成功,测试一波
  先去Windows的C:\Windows\System32\drivers\etc  下的hosts加入你的地址(例如: DSC00020.png
  然后去浏览器输入http://你配置的名称:50070  就可以看见进入的原谅色的页面了,里面可以看到很多信息,这里不详细说明了
  另外在右上角
   DSC00021.png
  Browse the file system下可以看见你HDFS里面有的文件,/是根目录,点击文件可以下载
  我们上传一个文件上去看看,
  在linux界面下
  hadoop fs -put jdk-7u65-linux-i586.tar.gz hdfs://hd0:9000/
  传个jdk到HDFS的根目录,然后再在刚才的页面进行查询
   DSC00022.png
  成功,现在把linux根目录下的jdk删掉,试试从HDFS下载
  hadoop fs -get hdfs://hd0:9000/jdk-7u65-linux-i586.tar.gz
    好了,测试结束
  免密配置下一节写出来
  暂时告一段落,下一节过几天发

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-408024-1-1.html 上篇帖子: Linux内核Socket参数调优 下篇帖子: 每天一个linux命令目录(转)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表