设为首页 收藏本站
查看: 2217|回复: 0

[经验分享] Linux下使用Eclipse开发Hadoop应用程序

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2014-6-6 10:07:15 | 显示全部楼层 |阅读模式
本帖最后由 gtdfe 于 2014-6-6 10:08 编辑

Hadoop版本:hadoop-0.20.2
Eclipse版本:eclipse-java-helios-SR2-linux-gtk.tar.gz

========================安装eclipse=======================
1、首先下载eclipse,我下载的是:eclipse-java-helios-SR2-linux-gtk.tar.gz

2、安装eclipse
(1)把eclipse-java-helios-SR2-linux-gtk.tar.gz解压到某个目录中,我解压到的是/home/wangxing/Development,得到eclipse目录
(2)在/usr/bin目录下创建一个启动脚本eclipse,执行下面的命令来创建:
sudo gedit /usr/bin/eclipse
然后在该文件中添加以下内容:
#!/bin/sh
export MOZILLA_FIVE_HOME="/usr/lib/mozilla/"
export ECLIPSE_HOME="/home/wangxing/Development/eclipse"
$ECLIPSE_HOME/eclipse $*
(3)修改该脚本的权限,让它变成可执行,执行下面的命令:
sudo chmod +x /usr/bin/eclipse

3、在Applications(应用程序)菜单上添加一个图标
sudo gedit /usr/share/applications/eclipse.desktop
然后在文件中添加下列内容:
[Desktop Entry]
Encoding=UTF-8
Name=Eclipse Platform
Comment=Eclipse IDE
Exec=eclipse
Icon=/home/wangxing/Development/eclipse/icon.xpm
Terminal=false
StartupNotify=true
Type=Application
Categories=Application;Development;

========================安装hadoop============================
关于hadoop在Linux下伪分布式的安装详见:http://blog.sina.com.cn/s/blog_62186b4601011c6a.html

========================在eclipse配置hadoop====================
1.在eclipse上安装hadoop插件
复制hadoop安装目录/contrib/eclipse-plugin/hadoop-0.20.203.0-eclipse-plugin.jar到eclipse安装目录/plugins/ 下

2.重启eclipse,配置hadoop installation directory。
如果安装插件成功,打开Window-->Preferens,你会发现HadoopMap/Reduce选项,在这个选项里你需要配置Hadoop installationdirectory。配置完成后退出。
1.jpg


3.配置Map/Reduce Locations
在Window-->Show View中打开Map/ReduceLocations,在Map/Reduce Locations中新建一个HadoopLocation。在这个View中,右键-->New HadoopLocation。在弹出的对话框中你需要配置Location name,如Hadoop,还有Map/Reduce Master和DFSMaster。这里面的Host、Port分别为你在mapred-site.xml、core-site.xml中配置的地址及端口。如:
2.jpg

本人hadoop的配置详见:http://www.oschina.net/code/snippet_176897_7976

4.新建项目。
File-->New-->Other-->Map/ReduceProject,项目名可以随便取,如WordCount。
复制hadoop安装目录/src/example/org/apache/hadoop/examples/WordCount.java到刚才新建的项目WordCount下,删除WordCount.java首行package
3.jpg



5.在本地新建word.txt,内容为:
java c++ python cjava c++ javascript helloworld hadoopmapreducejava hadoop hbase

6.通过hadoop的命令在HDFS上创建/tmp/workcount目录,命令如下:
bin/hadoop fs -mkdir /tmp/wordcount
通过copyFromLocal命令把本地的word.txt复制到HDFS上,命令如下:
bin/hadoop fs -copyFromLocal/home/wangxing/Development/eclipseWorkspace/word.txt /tmp/wordcount/word.txt

7.运行项目
(1).在新建的项目Hadoop,点击WordCount.java,右键-->RunAs-->Run Configurations
(2).在弹出的Run Configurations对话框中,点JavaApplication,右键-->New,这时会新建一个application名为WordCount
(3).配置运行参数,点Arguments,在Programarguments中输入你要传给程序的输入文件夹和你要求程序将计算结果保存的文件夹,如:
hdfs://localhost:9000/tmp/wordcount/word.txt  hdfs://localhost:9000/tmp/wordcount/out
(4)点击Run,运行程序
过段时间将运行完成,等运行结束后,查看例子的输出结果,使用命令:
bin/hadoop fs -ls /tmp/wordcount/out
发现有两个文件夹和一个文件,使用命令查看part-r-00000里的运行结果:
bin/hadoop fs -cat /tmp/wordcount/out/part-r-00000
4.jpg




运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-20242-1-1.html 上篇帖子: 基于Eclipse的Hadoop应用开发环境配置 下篇帖子: 关于Hadoop-0.20.203.0通过Eclipse连接编程的问题 应用程序 Linux 开发
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表