设为首页 收藏本站
查看: 1843|回复: 0

[经验分享] MapReduce with MongoDB and Python

[复制链接]
YunVN网友  发表于 2015-7-9 11:59:24 |阅读模式
  1 安装使用MongoDB
  a) 下载MongoDB, 请注意,32bit只能存2GB的内容(32-bit builds are limited to around 2GB of data)。
  b)配置好mongodb.config, 然后命令行:Mongod.exe --config /path/to/your/mongodb.config就可以了。
  c) 下载pymongo, 后面用python来写测试程序。
  请参阅:The Little MongoDB Book, (pdf)。
  2 MapReduce
  Map/reduce in MongoDB is useful for batch processing of data and aggregation operations. It is similar in spirit to using something like Hadoop with all input coming from a collection and output going to a collection. Often, in a situation where you would have used GROUP BY in SQL, map/reduce is the right tool in MongoDB.
  参见MongoDB网站上对MapReduce的介绍。Map/reduce 流程如下:
DSC0000.png
  
  3 例子
  以单词统计为例说明。输入文本是Obama的演讲词,可以看看里面里面单词的使用频率。如下图:
DSC0001.png
  
  MongoDB 运行客户端用JS脚本。
  Map程序为:
DSC0002.png
  Reduce程序为:
DSC0003.png
  
  客户端程序为:



from pymongo import Connection
from pymongo.code import Code

#'''
#Open a connection to MongoDb (localhost)
connection =  Connection()
db = connection.test
#Remove any existing data
db.texts.remove()
#Insert the data
lines = open('2009-obama.txt').readlines()
[db.texts.insert({'text': line}) for line in lines]
#Load map and reduce functions
map = Code(open('wordMap.js','r').read())
reduce = Code(open('wordReduce.js','r').read())

#Run the map-reduce query
results = db.texts.map_reduce(map, reduce, "collection_name")
#Print the results
for result in results.find():
    print result['_id'] , result['value']['count']
  
运行结果为:
DSC0004.png
  
  文章代码可以在这里下载。
  
  参见:MapReduce with MongoDB and Python 以及这里。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-84797-1-1.html 上篇帖子: MongoDB Windswos下安装 下篇帖子: MongoDB学习笔记(三) 在MVC模式下通过Jqgrid表格操作MongoDB数据
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表