设为首页 收藏本站
查看: 872|回复: 0

[经验分享] 自己动手一步一步安装hadoop(含编译hadoop的native本地包)

[复制链接]

尚未签到

发表于 2017-12-17 20:37:40 | 显示全部楼层 |阅读模式
  近期项目须要用到hadoop。边学习边应用,第一步无疑是安装hadoop。我安装的是hadoop-2.4.1。以下是具体步骤,做备忘以后查看
  一、下载依赖软件
  1、java
  hadoop官网说明仅仅支持java 6和7 ,下载最新的java7
  http://download.oracle.com/otn-pub/java/jdk/7u65-b17/jdk-7u65-linux-x64.tar.gz
  

  2、maven
  从maven官网下载http://maven.apache.org/download.cgi
  3、hadoop安装文件
  http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.4.1/hadoop-2.4.1.tar.gz
  

  4、hadoop源码(用于编译生成hadoop的native包)
  http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.4.1/hadoop-2.4.1-src.tar.gz
  

  5、hive
  http://mirrors.cnnic.cn/apache/hive/hive-0.13.1/apache-hive-0.13.1-bin.tar.gz
  

  6、protobuf(用于编译生成hadoop的native包)
  http://protobuf.googlecode.com/files/protobuf-2.5.0.tar.gz
  

  二、把上述软件分别解压到soft文件夹下,然后环境变量设置
  1、在管理员权限下centos 运行命令vi /etc/profile ubuntu下为sudo gedit /etc/profile
  2、在最后加入以下的路径
  export HADOOP_HOME=/root/soft/hadoop/hadoop-2.4.1
  
export HIVE_HOME=/root/soft/hadoop/apache-hive-0.13.1-bin
  
export JAVA_HOME=/root/soft/java/jdk1.7.0_65
  
export M2_HOME=/root/soft/apache-maven-3.2.1
  
export JRE_HOME=$JAVA_HOME/jre

  
export>  
export PATH=$JAVA_HOME/bin:$PATH:$JRE_HOME/lib:$HADOOP_HOME/bin:$HIVE_HOME/bin:$M2_HOME/bin
  

  依据解压后的详细路径改动
  通过source /etc/profile然环境变量生效
  3、验证
  java -version 验证java
  mvn -version 验证maven
  三、编译hadoop
  1、安装必要工具
  centos下:
  yum -y install  lzo-devel  zlib-devel  gcc autoconf automake libtool
  

  安装g++:yum -y install gcc-c++
  
安装cmake:yum -y install cmake
  

  安装openssl-devel:yum -y install openssl-devel
  

  ubuntu下为
  apt-get -y install maven build-essential autoconf automake libtool cmake zlib1g-dev pkg-config libssl-dev
  

  2、进入下载的protobuf-2.5.0文件夹下
  cd protobuf-2.5.0
  ./configure
  
make
  
make install
  

  (ubantu额外运行sudo ldconfig)
  3、进入hadoop-2.4.1-src编译hadoop
  cd hadoop-2.4.1-src
  mvn clean package -Pdist,native -DskipTests -Dtar
  

  4、普通情况下/root/soft/hadoop/hadoop-2.4.1-src/hadoop-hdfs-project/hadoop-hdfs-httpfs/downloads路径下的apache-tomcat-6.0.36.tar.gz下载不全然,
  正常大小应该为6.47M左右。假设不正确请官网手动下载。路径为http://archive.apache.org/dist/tomcat/tomcat-6/v6.0.36/bin/apache-tomcat-6.0.36.tar.gz
  5、替换hadoop-2.4.1/lib/native为编译后hadoop-2.4.1-src/hadoop-dist/target/hadoop-2.4.1/lib/native包
  四、配置ssh
  1、验证ssh
  

  ssh localhost   

没有安装的话。运行yum -y install openssh-clients  
2、运行命令

  

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa  
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
  

   五、配置hadoop  

1、etc/hadoop/core-site.xml:  

<configuration>  <property>
  <name>fs.defaultFS</name>
  <value>hdfs://localhost:9000</value>
  </property>
  
</configuration>
2、etc/hadoop/hdfs-site.xml:  

<configuration>  <property>
  <name>dfs.replication</name>
  <value>1</value>
  </property>
  
</configuration>
3、etc/hadoop/mapred-site.xml:  

<configuration>  <property>
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
  </property>
  
</configuration>
4、etc/hadoop/yarn-site.xml:  

<configuration>  <property>
  <name>yarn.nodemanager.aux-services</name>
  <value>mapreduce_shuffle</value>
  </property>
  
</configuration>
  
5、etc/hadoop/hadoop-env.sh:

  更改27行export JAVA_HOME=${JAVA_HOME}为
  export JAVA_HOME=实际路径
  

    六、启动hadoop  

1、进入hadoop文件夹 cd $HADOOP_HOME  
2、&#26684;式化namenode:bin/hdfs namenode -format
  
3、启动dfs:sbin/start-dfs.sh
  
4、验证dfs:http://localhost:50070/
  
5、启动yarn:sbin/start-yarn.sh
  
6、官方小样例
  
bin/hdfs dfs -mkdir /user
  
bin/hdfs dfs -mkdir /user/<username>(username必须为用户名)
  
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.1.jar grep input output 'dfs[a-z.]&#43;'
  
bin/hdfs dfs -get output output
  
cat output/*
  

  

    七、编译后的native包ubuntu链接为http://download.csdn.net/detail/zhulin40/7698377centos链接为http://download.csdn.net/detail/zhulin40/7698327  

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-425137-1-1.html 上篇帖子: 关于hadoop处理大量小文件情况的解决方法 下篇帖子: Apache Hadoop集群离线安装部署(一)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表