设为首页 收藏本站
查看: 1322|回复: 0

[经验分享] hadoop下安装mahout

[复制链接]

尚未签到

发表于 2017-12-17 07:40:18 | 显示全部楼层 |阅读模式
安装hadoop
  完成

安装mahout
  首先下载mahout压缩文件apache-mahout-distribution-0.12.2.tar.gz
  放到/home/hadoop/software-ljd/下
  解压该文件到/home/Hadoop/mahout下:
  

tar –zxvf apache-mahout-distribution-0.12.2.tar.gz –C /home/Hadoop/mahout/  

  完成后需要配置环境变量:/etc/profile文件需要新增(maven:非必须,java:必须,hadoop:必须, mahout:必须)如下的配置
  

###配置maven home  

  
export MAVEN_HOME
=/usr/share/maven  

  
export PATH
=$PATH:$MAVEN_HOME/bin  

  
### java配置
  

  
export JAVA_HOME
=/usr/lib/jvm/jdk1.8.0_101  

  
export JRE_HOME
=$JAVA_HOME/jre  

  
export>=.:$JAVA_HOME/lib:$JRE_HOME/lib  

  
export PATH
=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH  

  
###mahout配置
  

  
export MAHOUT_HOME
=/home/hadoop/mahout/apache-mahout-distribution-0.12.2  

  
export MAHOUT_CONF_DIR
=$MAHOUT_HOME/conf  

  
export PATH
=$MAHOUT_HOME/conf:$MAHOUT_HOME/bin:$PATH  

  

  
####配置mahout所需要的hadoop环境
  

  
export HADOOP_HOME
=/home/hadoop/hadoop-2.7.1  

  
export HADOOP_CONF_DIR
=${HADOOP_HOME}/etc/hadoop  

  
export PATH
=$PATH:$HADOOP_HOME/bin  

  
export HADOOP_HOME_WARN_SUPPRESS
=not_null  

  需要在root下配置,完成后保存,然后source /etc/profile 立即生效
  检测mahout是否配置成功
  到mahout-home下执行bin/mahout 查看
DSC0000.png

这里需要说明下,当你看到下面的代码时,以为是错的,其实不是,原因:

      MAHOUT_LOCAL:设置是否本地运行,如果设置这个参数就不会运行hadoop了,一旦设置这个参数,那HADOOP_CONF_DIR 和HADOOP_HOME 这两个参数的

      设置就自动失效了。

  

MAHOUT_LOCAL is not set; adding HADOOP_CONF_DIR to>

  
hadoop binary is not
in PATH,HADOOP_HOME/bin,HADOOP_PREFIX/bin, running locally  


在hadoop下使用mahout
  先启动hadoop
  首先下载测试数据
地址:http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data

  在hadoop下创建testdata目录
  bin/hadoop fs -mkdir /testdata(错误,需要创建的为/user/hadoop/testdata)
  

bin/hadoop fs -mkdir /user/hadoop  

  
bin
/hadoop fs -mkdir /user/hadoop/testdata(正确)  

  查看是否已经创建
  

bin/hadoop fs –ls /  

  然后把测试数据放到hadoop的testdata中
  

bin/hadoop fs -put /home/hadoop/software-ljd/data  /user/hadoop/testdata  


运行mahout上的kmeans算法:

  

bin/hadoop jar /home/hadoop/mahout/apache-mahout-distribution-0.12.2/mahout-examples-0.12.2-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job  

  最终运行结果
DSC0001.png

  最终生成的文件在hdfs的/user/Hadoop/output/data/part-m-00000中
  使用mahout vectordump –i /user/Hadoop/output/data/part-m-00000 –o /home/Hadoop/software-ljd/test.txt
  将该文件转换成正常可读文件并存储到本机的文件系统中(输出文件在非hadoop文件系统,但是输入文件需要时hadoop文件系统中的文件

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-424919-1-1.html 上篇帖子: 虚拟机搭建hadoop环境 下篇帖子: 3.hadoop完全分布式搭建
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表