查看: 663|回复: 0

[经验分享] 【Hadoop】矩阵相乘MapReduce实现

尚未签到

发表于 2015-7-13 10:19:19 | 显示全部楼层 |阅读模式

　　Method 1
　　A：M*K
　　B: k*N
　　Input
　　A : M行 sequenceFIle
　　B: N 行 sequenceFIle
　　
　　Map:
　　If read line from A
　　For j = 1->N
　　Collect()
　　If read line from B
　　For I = 1->M
　　Collect(,vector(k)>)
　　
　　
　　Reduce:
　　While(iterator.hasNext())
　　Vi = iterator.next()
　　Result = v1*v2
　　Output(,result);
　　
　　优点：逻辑简单，直接
　　缺点数据打散，还需要一次mapreduce还原成矩阵。
　　对Map 修改可以分块进行可以大大减少空间占用
　　原来相当于分块数 F = M or N 空间复杂度为（N*M+M*N）*K =O（2 M*N *K）
　　如果指定分块个数 F 为常数空间复杂度为 O ((M+N)*K)
　　只要F M:
　　For j = 1 ->N:
　　n[j]= m*n[j]
　　collect(
　　
　　
　　Reduce
　　SumVector[N]
　　While(iterator.hasNext())
　　for j= 1->N
　　SumVector[j] += iterator.next()[j]
　　
　　collect()
　　
　　output : M*N matrix
　　
　　优点直接生成矩阵
　　缺点需要同时读入两个数据，map不好实现，也需要先通过一个mapreduce merge

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表，该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有，请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意，请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息，一经发现立即删除。若您因此触犯法律，一切后果自负，我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集，我们仅提供一个展示、介绍、观摩学习的平台，我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责，亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏，不得用于商业或者其他用途，否则，一切后果均由您自己承担，我们对此不承担任何法律责任
7、如涉及侵犯版权等问题，请您及时通知我们，我们将立即采取措施予以解决
8、联系人Email：admin@iyunv.com 网址：www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址：https://www.yunweiku.com/thread-86195-1-1.html 上篇帖子： hadoop的dfs.umask 下篇帖子：淘宝Hadoop集群的概况(转)

使用道具举报