yunde110 发表于 2017-1-7 10:54:01

Apache Mahout 0.1 发布:机器学习算法

Apache Lucene 开发团队很高兴的宣布Apache Mahout 0.1 发布。Apache Mahout是Apache Lucene一个子项目,目标是提供可扩展的机器学习算法实现,也采用 Apache license许可。第一个公开发布版本包括 聚类 clustering,分类classification,合作过滤collaborative filtering 和 进化编程evolutionary programming。大部分算法在 Hadoop (http://hadoop.apache.org) 之上实现用于扩展。

Apache Mahout 0.1版本主要是为项目提供一个基础,并吸引更多的开发者。

下载Apache Mahout :http://www.apache.org/dyn/closer.cgi/lucene/mahout/0.1/mahout-0.1-project.tar.gz

Apache Mahout 主页:http://lucene.apache.org/mahout

Apache Lucene(非常优秀的开源的文本搜索引擎)项目宣布发布Apache Mahout 0.1。Apache Mahout是Apache Lucene的一个副产品,目标是提供可扩展的,遵从Apache协议的机器学习算法实现。首次发布版本包括实现集群、分类、协同过滤和进化的程序。  Apache Mahout 0.1是该项目首次发布的版本。
  详情请见Apache问题追踪:
https://issues.apache.org/jira/secure/ReleaseNote.jspa?projectId=12310751styleName=Htmlversion=12312976
可从以下地址得到Apache Mahout的源程序:
http://www.apache.org/dyn/closer.cgi/lucene/mahout/0.1/mahout-0.1-project.tar.gz
Maven 2用户通过Central Maven Repositories同样可用Apache Mahout:
http://repo1.maven.org/maven2/org/apache/mahout/
http://mirrors.ibiblio.org/pub/mirrors/maven2/org/apache/mahout/
如果从镜像站点下载,请输入以下序列号:
http://www.apache.org/dist/lucene/mahout/KEYS
更多关于Apache Mahout的消息,请访问项目主页:
http://lucene.apache.org/mahout
最近看了最近刚发布的开放源代码项目mahout,实现了很多机器学习的算法和一些实用的系统,对于从事机器学习和web挖掘的人员来说是个很值得学习的资源。mahout是基于hadoop的,可以分布式运行,至此Lucence、Nutch、Mahout为构建开源的分布式的搜索引擎和Web挖掘提供了完整的支持,三剑合璧,威力无穷。Mahout的代码风格延续了Nutch的优良风格,代码可读性很强,包含了推荐系统、聚类中的kmeans,fuzzykmeans,
canopy, dirichlet,分类中的bayes、cbayes等算法的实现,以及交叉验证,计算正确率,各种距离,模型的构建等。还缺少像神经网络这个强大工具的实现,但未来很可能会加上。

<!--这篇新闻中是否有争论或者观点交锋呢?如果希望读者参与,请点击<a href="http://pkzone.csdn.net/AdminManage/Editor_Apply.aspx" mce_href="http://pkzone.csdn.net/AdminManage/Editor_Apply.aspx">这里</a>,创建一个观点PK-->
页: [1]
查看完整版本: Apache Mahout 0.1 发布:机器学习算法