设为首页 收藏本站
查看: 610|回复: 0

[经验分享] 从事分布式系统、计算、hadoop 等方面工作需要哪些基础?

[复制链接]

尚未签到

发表于 2018-10-28 13:14:34 | 显示全部楼层 |阅读模式
  作者:知乎用户
  链接:https://www.zhihu.com/question/19868791/answer/18144881
  来源:知乎
  著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

  •   先看百度文库这篇《分布式系统工程实践》http://wk.baidu.com/view/895a2a3467ec102de2bd8902?pcf=2#page/1/1375282274254  ;
  •   再看“Google三大论文”;
  •   接下来再研究Hadoop的实现。
  首先。lz需要了解分布式系统是一个很广泛的概念。任何系统可以大致划分成三个方面:计算,存储,网络。分布式系统也不例外。比如Hadoop/Spark是分布式计算系统,HDFS/Tachyon/Ceph这些是分布式存储系统,分布式数据库(诸如BigTable,DynamoDB)也是存储系统。只要是分布式系统,必定是含有网络的,纯粹的分布式网络系统很少,SDN/Openflow这些可以算是分布式网络分系统。
  其次。选择系统的教程来学习。比较好的书籍上面已经有推荐了,MIT的课程也不错。初学者进行一个系统的学习还是很有必要的。如果你已经有OS的基础,写过网络编程,了解CAP原理,不进行这些系统的学习也是可以的。
  再次。阅读好的论文,论文在精不在多。Google的MapReduce是计算系统的经典之作,Amazon的dynamodb是数据库系统的经典之作,Google的GFS算是文件系统方面比较好的论文。系统领域的顶会是SOSP/OSDI,偏重网络的还有SIGCOMM.
  再次。玩弄和hack主流的分布式系统。自己部署一个Hadoop集群或者Spark集群,在上面写写简单的例子,自己实地感受一下这些分布式。选择主流的系统是因为分布式系统对于初学者有很多的坑,主流的系统有足够多的参考资料。如果在上面跑跑程序之后对背后的原理感兴趣,可以去看看源代码。论文只能够提供大概思路,好的idea,如果实现很差,性能也会差别很大。这个阶段需要你学会一些网络知识和系统配置管理。
  最后。当你已经能够hack主流的分布式系统后,你就可以到达自己根据需求来定制自己的分布式系统了。这个阶段,你会对已有的系统进行很多思考,会阅读很多相关的论文,并且自己会不断的进行demo验证,最终实现出你自己的想法。到达这个阶段之后,你就真正走入了分布式系统这个领域。
  技术类学习的第一步是实践。
  可以先去学着搭环境,写个hello world程序(hadoop中的word count)。
  接下来就是多写,多想,逐步提升。
  当你有了实战所需的技术和经验,需要对自己所学的内容做一个升华时,或者当你的实战能力遭遇到了瓶颈的时候,再去看书。


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-627535-1-1.html 上篇帖子: 如何高效阅读 Spark 和 Hadoop 这类大型开源项目源代码? 下篇帖子: hadoop的安全系列
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表