Hadoop 2.4安装与配置

jericho0702 发表于 2018-10-30 09:03:01

一、hadoop2.4编译方法可参考：Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0。
二、准备工具
　　1.部署准备两个机器test1为Master，test2为Slave。
　　在两个机器上分别vim /etc/hosts，加入如下内容：
192.168.1.100 test1　　
192.168.1.200 test2
　　2.增加hadoop用户
groupadd hadoop　　
useradd hadoop -g hadoop
　　
passwd hadoop
　　3.设置Master无密码登录slave
　　在test1下生成公钥/私钥对并复制到test2上。
su hadoop　　
ssh-keygen -t rsa -P ''
　　
scp ~/.ssh/id_rsa.pub hadoop@test2:~/.ssh/id_rsa.pub
　　test2把从test1复制的id_rsa.pub添加到.ssh/authorzied_keys文件里
cat id_rsa.pub >> authorized_keys　　
chmod 600 .ssh/authorized_keys
　　4.修改句柄数：
ulimit -n 65535　　
vim /etc/security/limits.conf增加如下内容：
　　
\* hard nofile 65535
　　
\* soft nofile 65535
三、配置hadoop
　　将编译好的hadoop2.4.0解压后修改etc/hadoop目录里的配置文件。
　　1.修改hadoop-env.sh
export JAVA_HOME=/opt/jdk　　2.修改core-site.xml
　　
fs.default.name
　　
hdfs://HDP125:9000
　　

　　

　　
hadoop.tmp.dir
　　
/home/${user.name}/tmp
　　

　　

　　
fs.trash.interval
　　
1440
　　

　　说明：
　　fs.defaultDFS：设置NameNode的IP和端口
　　hadoop.tmp.dir：设置Hadoop临时目录，（默认/tmp，机器重启会丢失数据！）
　　fs.trash.interval：开启Hadoop回收站
　　3.修改hdfs-site.xml
　　
dfs.replication
　　
1
　　

　　

　　
dfs.namenode.name.dir
　　
/home/${user.name}/dfs_name
　　

　　

　　
dfs.datanode.data.dir
　　
/home/${user.name}/dfs_data
　　

　　

　　
dfs.support.append
　　
true
　　

　　

　　
dfs.datanode.max.xcievers
　　
4096
　　

　　说明：
　　dfs.replication：文件复本数
　　dfs.namenode.name.dir：设置NameNode存储元数据(fsimage)的本地文件系统位置
　　dfs.datanode.data.dir：设置DataNode存储数据的本地文件系统位置
　　dfs.support.append：设置HDFS是否支持在文件末尾追加数据
　　dfs.datanode.max.xcievers：设置datanode可以创建的最大xcievers数
　　4.修改yarn-site.xml
　　
yarn.nodemanager.aux-services
　　
mapreduce_shuffle
　　

　　

　　
yarn.resourcemanager.hostname
　　
master
　　

　　

　　
yarn.nodemanager.aux-services.mapreduce.shuffle.class
　　
org.apache.hadoop.mapred.ShuffleHandler
　　

　　

　　
yarn.timeline-service.hostname
　　
master
　　

　　5.修改mapred-site.xml
　　
mapreduce.framework.name
　　
yarn
　　

　　6.修改slave
test1　　
test2
　　7.把配置好的Hadoop程序复制到其它节点
scp -r /opt/hadoop hadoop@test2:/opt/　　
chown -R hadoop:hadoop /opt/hadoop
四、启动和关闭hadoop
　　1.第一次使用一个分布式文件系统，需要对其进行格式化：
./bin/hadoop namenode –format　　2.启动Hadoop：
sbin/start-all.sh　　3.关闭Hadoop：
sbin/start-all.sh　　4.Hadoop自带的WEB管理界面
　　http://test1:50070

页: [1]

运维网's Archiver

Hadoop 2.4安装与配置