设为首页 收藏本站
查看: 905|回复: 0

[经验分享] linux上hadoop2.4.0安装配置

[复制链接]

尚未签到

发表于 2018-10-29 07:07:28 | 显示全部楼层 |阅读模式
  1 环境准备
  安装java-1.6(jdk)
  安装ssh
  1.1 安装jdk
  (1)下载安装jdk
  在/usr/lib下创建java文件夹,输入命令:
cd /usr/lib  
mkdir java
  输入命令:
sudo apt-get install sun-java6-jdk  下载后执行安装文件
  (2)配置环境变量
  输入命令:
sudo gedit /etc/environment  将如下内容加入其中:
JAVA_HOME=/usr/lib/java/jdk1.6="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:  
/usr/lib/java/jdk1.6.0_45/bin:/usr/lib/java/jdk1.6.0_45:/home/ylf/hadoop/bin:/home/ylf/hadoop/sbin"=/usr/lib/java/jdk1.6.0_45/lib:/usr/lib/java/jdk1.6.0_45/jre/lib
  其中path部分是在你原有的path变量基础上加入你所安装的jdk路径。
  执行如下命令使得配置生效:
source /etc/environment  (3)验证java是否安装成功
  输入命令:
java -version  1.2 配置ssh免密码登录
  输入命令:
sudo apt-get install ssh  配置可以无密码登陆本机:
  在当前用户目录下新建隐藏文件.ssh,输入命令:
mkdir .ssh  接下来,输入命令:
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa  这个命令会在.ssh文件夹下创建两个文件id_dsa及id_dsa.pub,这是一对私钥和公钥,然后把id_dsa.pub(公钥)追加到授权的key里面去,输入命令:
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys  验证ssh已安装成功及无密码登陆本机,输入命令:
ssh -version  显示结果:
Bad escape character 'rsion'.  这显示ssh已经安装成功。
  登陆ssh,输入命令:
ssh localhost  第一次登陆可能会询问是否继续链接,输入yes即可,以后登陆直接登进去。
  显示结果:
Welcome to Ubuntu 14.04.1 LTS (GNU/Linux 3.13.0-32-generic x86_64) * Documentation:  https://help.ubuntu.com/Last login: Sun Oct 12 13:27:58 2014 from localhost  2.安装hadoop2.4.0
  2.1 下载hadoop2.4.0
  从官网上下载hadoop-2.4.0.tar.gz
  2.2 解压hadoop-2.4.0.tar.gz,并重命名为hadoop
tar xzvf hadoop-2.4.0.tar.gz  
mv hadoop-2.4.0 hadoop
  2.3 配置环境变量
sudo gedit /etc/environment  在文件中加入:
HADOOP_HOME=/home/ylf/="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:  
/usr/lib/java/jdk1.6.0_45/bin:/usr/lib/java/jdk1.6.0_45:/home/ylf/hadoop/bin:/home/ylf/hadoop/sbin"
  其中path为原有的path变量中加入hadoop的路径。
  执行如下命令,使之生效:
source /etc/environment  2.4单机模式配置
  单机模式不用任何配置就可以直接进行测试。
  运行hadoop自带的wordcount实例,统计一批文本文件中单词出现的次数
bin/hadoop jar /usr/local/hadoop2.4.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.0.jar wordcount input output  其中input已经上传至hdfs中,上传命令:
./bin/hdfs dfs -put input /input  2.5 伪分布式模式
  2.5.1 修改配置文件
  在当前用户目录下创建文件夹hadoop_tmp,输入命令:
mkdir hadoop_tmp  配置文件都在安装目录的etc/hadoop下
  修改hadoop-env.sh
  将export JAVA_HOME=${JAVA_HOME}改为你自己安装的jdk路径:
export JAVA_HOME=/usr/lib/java/jdk1.6.0_45  修改core-site.xml

  
  
  
    fs.defaultFS
  
    hdfs://localhost:9000
  
    true
  
  
  

  
  
  
    hadoop.tmp.dir
  
    /home/ylf/hadoop_tmp
  
  
  


  修改hdfs-site.xml:

  
        
  
      dfs.namenode.name.dir
  
      /home/ylf/hadoop/dfs/namenode
  
      
  
   
  
     
  
       dfs.datanode.data.dir
  
       /home/ylf/hadoop/dfs/datanode
  
      
  
   
  
   
  
      dfs.http.address
  
      localhost:50070
  
       0
  
   
  
   
  
      dfs.replication
  
      1
  
   
  
   
  
      dfs.permissions
  
      
  
   
  


  修改mapred-site.xml

  
        
  
      mapreduce.framework.name
  
      yarn
  
   
  
   
  
      mapred.job.tracker
  
      hdfs://localhost:9001
  
   
  
        
  
          mapred.system.dir
  
          file:/home/ylf/hadoop/mapred/system
  
          true
  
        
  

  
        
  
          mapred.local.dir
  
          file:/home/ylf/hadoop/mapred/local
  
          true
  
        
  


  修改yarn-site.xml:

  

  

  
  
  
    yarn.nodemanager.aux-services
  
    mapreduce_shuffle
  
    shuffle service that needs to be set for Map Reduce to run
  
  
  
  
  
    yarn.resourcemanager.hostname
  
    localhost
  
    hostname of Resource Manager
  
  
  


  修改slaves文件
localhost  默认就是localhost,所以不用修改。
  启动伪分布式模式:
  第一次启动都要格式化下数据文件,命令:
./bin/hdfs namenode -format  启动hadoop,命令:
./sbin/start-all.sh  查看,命令:
jps  结果:

  表示启动成功。
  2.6 web访问端口
NameNode50070ResourceManager8088MapReduce JobHistory Server19888  访问http://localhost:50070

  访问http://localhost:8088

  其中19888端口要启动JobHistoryServer进程,启动命令如下:
./sbin/mr-jobhistory-daemon.sh start historyserver  然后访问http://localhost:19888

  到此为止,hadoop的伪分布式安装配置讲解完毕。
  hadoop基本命令:
  1.查看hdfs 文件夹下文件命令
hadoop fs -ls dir  2.从本地上传至hdfs
hadoop fs -copyFromLocal input/hello.txt /input/hello.txt  3.从hdfs下载至本地
hadoop fs -copyToLocal /input/hello.txt input/hello.copy.txt  4.创建文件夹
hadoop fs -mkdir testDir  5.查看hdfs文件列表
hadoop fs -lsr /testDir


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-627692-1-1.html 上篇帖子: Hadoop运维记录系列(二十) 下篇帖子: How to install Hadoop 2.7.3 cluster on CentOS 7.3
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表