设为首页 收藏本站
查看: 835|回复: 0

[经验分享] 学习Hadoop笔记(一)

[复制链接]

尚未签到

发表于 2018-10-30 08:06:30 | 显示全部楼层 |阅读模式
  从事软件开发将近四年,一直热衷于各种技术语言,但是感觉自己始终都不知道自己到底喜欢从事哪个方面的开发,毕业的前两年一直在大连做对日软件外包,做了两年后觉得真的没有什么意思,软件的设计都不是自己做的,只是需要按照需求进行程序的书写,所以和几个同事一直离职后来了北京,其实来到北京想的和现实还是不一样,最后我还是干了类似外包的项目,写这篇日记我心里一直很不确定自己喜欢什么样的技术喜欢什么样的语言,所以我这回准备开始写blog来记录自己的学习的点点滴滴,我心里优先喜欢的就是手机开发,好在现在的工作给我很多空闲的时间,让我有很大的空间学习,所以再这里给自己一个鼓励争取一周至少一篇关于自己学习的blog。我学习的方向现在分两个方向,最后来确定自己到底喜欢哪个,再为之努力奋斗。一个就是手机方向,一个就是Hadoop方向。我觉得未来中国的软件市场是非常大的,手机互联网这不用说现在还是很热,将来可能会慢慢趋于稳定,但总之这10几年应该还是很稳定的,我对未来的看法就是未来数据是王道,谁掌握了越多的数据谁就能掌握主动权,但掌握数据多没有用,得要合理分析所有的数据,才能把数据转化为相应的价值。所以另一个方向就是研究大数据,大数据的处理。今天这篇blog就来说说Hadoop的大数据处理心得笔记。我现在看的这本就是《Hadoop权威指南第二版中文版》。通过学习来一步一步成长,也算是自己的学习记录吧。
  开始记录笔记:

  •   Hadoop是apache里的一个开源的项目。核心是谷歌公司的对于大数据处理的框架,基于MapReduce软件设计模型。是大数据分布式系统的一个开源软件项目,对于处理大数据分析现在是比较主流的软件框架。
  •   hadoop处理方式:数据输入->MapReduce的程序和配置->输出。
      Map任务:数据的key,value生成。输出到本地磁盘,因为是中间结果,如果放在HDFS(分布式文件系统)未免小题大做。
      Reduce任务:数据的解析,输出自己预期的结果。输出到HDFS,以实现可靠数据。
  •   我的理解Reduce相当一个统领全局的人,它需要某种规则的数据就需要map来给它提供,map里可以通过分区提供给不同的Reduce去处理。当没有Reduce时,map就直接发送到HDFS上。
  •   map和Reduce中可以有个合并函数进行过度,合并函数在map里运用可以减少对于map输出的数据量。有效减少map和Reduce之间的数据传输量。但对于合并函数还是视情况运用。比如求平均值等一些需要全数据的时候就不能使用。


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-628207-1-1.html 上篇帖子: hadoop和hbase的安全认证Kerberos部署 下篇帖子: 学习Hadoop笔记(二)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表