设为首页 收藏本站
查看: 1859|回复: 0

[经验分享] Hadoop单机模式配置

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2014-1-23 09:11:28 | 显示全部楼层 |阅读模式
默认情况下,Hadoop被配置成以非分布式模式运行的一个独立Java进程。这对调试非常有帮助。
(只有一个JVM进程,没有分布式,不使用HDFS)

环境:
Ubuntu13.10 下载
jdk-7u45-linux-i586.tar 下载
hadoop-2.2.0.tar.gz 更新发布 下载 (64位系统需要下载src自行编译)
安装:
在用户主目录新建文件夹setupEnv,将jdk-7u45-linux-i586.tar和hadoop-2.2.0.tar.gz放在该目录下,即: ~/setupEnv
Java将安装在/usr/local/java目录, Hadoop将安装在/opt目录

①安装Java
创建文件夹
cd /usr/localsudo mkdir java
释放文件
cd ~/setupEnvsudo tar zxvf jdk-7u45-linux-i586.tar.gz -C  /usr/local/java
修改系统环境变量
sudo gedit /etc/profile
在末尾添加以下内容 :
#Javaexport JAVA_HOME=/usr/local/java/jdk1.7.0_45export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH export CLASSPATH=$CLASSPATH:.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
将系统默认的jdk修改过来(两种更新方法,任选其一)
source /etc/profile
sudo update-alternatives --install /usr/bin/java java /usr/local/java/jdk1.7.0_45/bin/java 300 sudo update-alternatives --install /usr/bin/javac javac /usr/local/java/jdk1.7.0_45/bin/javac 300
测试
java -version

②Hadoop安装
释放文件并软连接(用户以后版本更新)
cd ~/setupEnvsudo tar zxvf hadoop-2.2.0.tar.gz -C /optsudo ln -s /opt/hadoop-2.2.0 /opt/hadoop
修改系统环境变量
sudo gedit /etc/profile
在末尾添加以下内容 :
#hadoopexport HADOOP_HOME=/opt/hadoopexport PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
将配置文件启用:
source /etc/profile
测试
hadoop version
配置hadoop-env.sh
cd /opt/hadoop/etc/hadoopsudo gedit hadoop-env.sh  

把JAVA_HOME指定为:export JAVA_HOME=/usr/local/java/jdk1.7.0_45

③运行测试 (注:Hadoop刚完成安装不修改配置文件即为单机模式)
测试一:wordcount
在主文件下新建hadoopTest文件夹,创建in子文件夹,创建任意文本文档内容
cd /opt/hadoop/share/hadoop/mapreducehadoop jar hadoop-mapreduce-examples-2.2.0.jar wordcount ~/hadoopTest/in ~/hadoopTest/out
查看结果
cat ~/hadoopTest/out/part-r-00000


hadoop单机运行可以不打包成jar: hadoop 主类名 [输入输出目录等参数]
相比用java运行,使用hadoop命令会自动添加hadoop库文件到classpath

输出命名方式:
map输出:part-m-nnnnn
reduce输出:part-r-nnnnn
其中nnnnn为分块序号,从0开始。
分布式下Map的输出是在硬盘上而不是hdfs,因为它作为中间结果是临时的,一旦写入hdfs就会分布式存储并备份。



example中的样例程序说明
221950372108.jpg




运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-14536-1-1.html 上篇帖子: Hadoop作业提交之TaskTracker 启动task 下篇帖子: Hadoop伪分布模式配置 单机
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表