jericho0702 发表于 2018-10-30 09:03:01

Hadoop 2.4安装与配置

一、hadoop2.4编译方法可参考:Linux64位操作系统(CentOS6.6)上如何编译hadoop2.4.0。
二、准备工具
  1.部署准备两个机器test1为Master,test2为Slave。
  在两个机器上分别vim /etc/hosts,加入如下内容:
192.168.1.100 test1  
192.168.1.200 test2
  2.增加hadoop用户
groupadd hadoop  
useradd hadoop -g hadoop
  
passwd hadoop
  3.设置Master无密码登录slave
  在test1下生成公钥/私钥对并复制到test2上。
su hadoop  
ssh-keygen -t rsa -P ''
  
scp ~/.ssh/id_rsa.pub hadoop@test2:~/.ssh/id_rsa.pub
  test2把从test1复制的id_rsa.pub添加到.ssh/authorzied_keys文件里
cat id_rsa.pub >> authorized_keys  
chmod 600 .ssh/authorized_keys
  4.修改句柄数:
ulimit -n 65535  
vim /etc/security/limits.conf增加如下内容:
  
\*    hard    nofile   65535
  
\*    soft    nofile   65535
三、配置hadoop
  将编译好的hadoop2.4.0解压后修改etc/hadoop目录里的配置文件。
  1.修改hadoop-env.sh
export JAVA_HOME=/opt/jdk  2.修改core-site.xml
  
    fs.default.name
  
    hdfs://HDP125:9000
  

  

  
    hadoop.tmp.dir
  
    /home/${user.name}/tmp
  

  

  
    fs.trash.interval
  
    1440
  

  说明:
  fs.defaultDFS:设置NameNode的IP和端口
  hadoop.tmp.dir:设置Hadoop临时目录,(默认/tmp,机器重启会丢失数据!)
  fs.trash.interval:开启Hadoop回收站
  3.修改hdfs-site.xml
  
    dfs.replication
  
    1
  

  

  
    dfs.namenode.name.dir
  
    /home/${user.name}/dfs_name
  

  

  
    dfs.datanode.data.dir
  
    /home/${user.name}/dfs_data
  

  

  
    dfs.support.append
  
    true
  

  

  
    dfs.datanode.max.xcievers
  
    4096
  

  说明:
  dfs.replication:文件复本数
  dfs.namenode.name.dir:设置NameNode存储元数据(fsimage)的本地文件系统位置
  dfs.datanode.data.dir:设置DataNode存储数据的本地文件系统位置
  dfs.support.append:设置HDFS是否支持在文件末尾追加数据
  dfs.datanode.max.xcievers:设置datanode可以创建的最大xcievers数
  4.修改yarn-site.xml
  
yarn.nodemanager.aux-services
  
mapreduce_shuffle
  

  

  
yarn.resourcemanager.hostname
  
master
  

  

  
yarn.nodemanager.aux-services.mapreduce.shuffle.class
  
org.apache.hadoop.mapred.ShuffleHandler
  

  

  
yarn.timeline-service.hostname
  
master
  

  5.修改mapred-site.xml
  
mapreduce.framework.name
  
yarn
  

  6.修改slave
test1  
test2
  7.把配置好的Hadoop程序复制到其它节点
scp -r /opt/hadoop hadoop@test2:/opt/  
chown -R hadoop:hadoop /opt/hadoop
四、启动和关闭hadoop
  1.第一次使用一个分布式文件系统,需要对其进行格式化:
./bin/hadoop namenode –format  2.启动Hadoop:
sbin/start-all.sh  3.关闭Hadoop:
sbin/start-all.sh  4.Hadoop自带的WEB管理界面
  http://test1:50070


页: [1]
查看完整版本: Hadoop 2.4安装与配置