Hadoop第一式：配置Linux环境

yes-no · 发表于 2017-11-17 20:35:37

　　所有操作在虚拟机下完成，虚拟机软件选用VMware Workstation Pro 12 （后文简称为VM）
　　关于Linux安装不再阐述一、网络环境配置
　　1）Windows界面
　　首先在VM页面，点击虚拟网络编辑器

　　进入后把vmnet8改为nat模式

　　次之，点击上图红框右边的NAT设置网关，前缀随意，记得数字1结尾

　　然后修改子网IP，要求在网段内

　　继而设置本机的vmnewt8，博主为windows10
　　在网络连接设置中

　　设置ipv4，双击即可

　　设置与刚才虚拟机设置的ip为统一网段内

　　2）Linux界面
　　setup指令，进入设置伪图形界面
　　选择网络设置

　　选择当前虚拟网卡（当前我的系统下只有一块虚拟网卡，最多可以有8块）

　　进入

　　从上至下为
　　网卡名字、网卡设备、是否自动获取（若自动获取DHCP中为*）、IP地址、子网掩码、默认网关、DNF服务器、备用DNS服务器
　　设置完毕后退出，然后重启网关
　　重启指令为　　sudo service network restart

　　然后cmd下测试

、

　　成功
　　网络配置到此结束
　　二、软件环境配置
　　由此开始不再在linux虚拟机上直接操作，使用SecureCRTPortable进行远程连接
　　打开软件后点击闪电图标连接

　　设置

　　输入密码并保存密码

　　进入成功后，在界面ALT+P 可进入SFTP界面（SSH）
　　使用 put 路径（例如：put C:\jdk-7u_65-i585.tar.gz）
　　可将本机软件拷贝至远程主机（linux虚拟机）

　　传输完毕后删除不需要的文件夹
　　rm -rf 文件夹名
　　新建文件夹application
　　mkdir application
　　然后把jdk解压至application文件夹
　　tar -zxvf jdk-7u_65-i585.tar.gz -C application/
　　　　

　　　　接下来配置环境变量（CentOS下 vi与vim没区别）　　shift+g 到达文章最下一行，gg第一行　　shift+$到达行尾
　　　　sudo vi /etc/profile
　　　　在文件最后添加　　SecureCRTPortable左键选中是复制，右键一下就是粘贴
　　export JAVA_HOME=/home/hadoop/app/jdk-7u_65-i585
　　export PATH=$PATH:$JAVA_HOME/bin
　　刷新配置文件
　　source /etc/profile
　　检测是否成功
　　java -version

　　jdk环境变量搞定
　　下面进行Hadoop配置
　　文件传输、解压方法和jdk一样
　　解压到application后删除 doc 帮助文档（不删也没事，只是节省点存储空间）
　　接下来修改配置文件，Hadoop的配置文件在/etc/hadoop目录下，需要修改的文件如下所示

　　第一个：hadoop-env.sh
　　vim hadoop-env.sh
#第27行　　数字打27然后按enter键可以从文头直达27行
　　#这里要写死，原本是自动读取系统变量，但有时候读不到
　　#echo $JAVA_HOME 可以输出变量值
　　export JAVA_HOME=/home/hadoop/app/jdk1.7.0_65

第二个：core-site.xml　　
<property>
<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>
</property>

<property>
<name>hadoop.tmp.dir</name>

<value>/home/hadoop/application/hadoop-2.4.1/data</value>
</property>
　　以上配置都在<configuration></configuration>中加入

第三个：hdfs-site.xml　　
<property>
<name>dfs.replication</name>
<value>1</value>
</property>

第四个：mapred-site.xml　　mv mapred-site.xml.template mapred-site.xml

　　vim mapred-site.xml

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

第五个：yarn-site.xml　　
<property>
<name>yarn.resourcemanager.hostname</name>
<value>localhost</value>

</property>

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

　　注意：要配置DataNode的节点地址在slaves.xml里面添加
　　然后先关闭防火墙
　　sudo service iptables status　　查看防火墙状态
　　sudo service iptables stop　　　关闭防火墙
　　因为只是当前关闭防火墙，防火墙是自启的，所以要永久关闭服务
　　sudo chkconfig iptables --list　　看到各级别防火墙自启状态
　　sudo chkconfig iptables off　　　关闭自启防火墙
　　可以一个个端口号往防火墙白名单里添加，但Hadoop一般是在内网跑，干脆直接关闭，懒得麻烦了
　　现在配置下环境变量　
　　sudo vi /etc/proflie
　　最下面加2行
　　export HADOOP_HOME=/home/hadoop/app/hadoop-2.4.1
　　export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
　　配置完成后格式化Hadoop
　　记得刷新 source /etc/profile
　　hadoop namenode -format

　　搞定
　　现在准备启动Hadoop，进入Hadoop的sbin文件夹，可以看见很多的启动指（.sh结尾的）
　　启动
　　start-dfs.sh
　　 start-yarn.sh
　　　　jps查看进程
　　

　　成功，测试一波
　　先去Windows的C:\Windows\System32\drivers\etc　下的hosts加入你的地址（例如：

）
　　然后去浏览器输入http://你配置的名称:50070　　就可以看见进入的原谅色的页面了，里面可以看到很多信息，这里不详细说明了
　　另外在右上角
　　

　　Browse the file system下可以看见你HDFS里面有的文件，/是根目录，点击文件可以下载
　　我们上传一个文件上去看看，
　　在linux界面下
　　hadoop fs -put jdk-7u65-linux-i586.tar.gz hdfs://hd0:9000/
　　传个jdk到HDFS的根目录，然后再在刚才的页面进行查询
　　

　　成功，现在把linux根目录下的jdk删掉，试试从HDFS下载
　　hadoop fs -get hdfs://hd0:9000/jdk-7u65-linux-i586.tar.gz
　　　　好了，测试结束
　　免密配置下一节写出来
　　暂时告一段落，下一节过几天发

账号		自动登录	找回密码
密码			立即注册

Centos6.5×64安装配置openmeetings3.0.3详

大疆运维招人啦，

C++ :try 语句块和异常处理

C++的多态

Red Hat RHCE 8 (EX294) Cert Guide

Java/C++ 区别：看完这一篇，就够用！

别再用过时库了！这 13 个顶级 C++ 库才是

[经验分享] Hadoop第一式：配置Linux环境

扫码加入运维网微信交流群