设为首页 收藏本站
查看: 863|回复: 0

[经验分享] Hadoop学习笔记系列文章导航

[复制链接]

尚未签到

发表于 2015-7-12 07:04:11 | 显示全部楼层 |阅读模式
一、为何要学习Hadoop?
DSC0000.jpg
  这是一个信息爆炸的时代。经过数十年的积累,很多企业都聚集了大量的数据。这些数据也是企业的核心财富之一,怎样从累积的数据里寻找价值,变废为宝炼数成金成为当务之急。但数据增长的速度往往比cpu和内存性能增长的速度还要快得多。要处理海量数据,如果求助于昂贵的专用主机甚至超级计算机,成本无疑很高,有时即使是保存数据,也需要面对高成本的问题,因为具有海量数据容量的存储设备,价格往往也是天文数字。成本和IT能力成为了海量数据分析的主要瓶颈。
   DSC0001.png
    Hadoop这个开源产品的出现,打破了对数据力量的压制。Hadoop源于Nutch这个小型的搜索引擎项目。而Nutch则出自于著名的开源搜索引擎解决方案Lucene,而Lucene则来源于对Google的学习模仿。在Hadoop身上有着明显的Google的影子。HDFS是GFS的山寨版,Map-Reduce的思想来源于Goolge对Page rank的计算方法,HBase模仿的是Big Table,Zookeeper则学习了Chubby。Google巨人的力量尽管由于商业的原因被层层封锁,但在Hadoop身上得到了完美的重生和发展。
  从2006年Apache基金会接纳Hadoop项目以来。Hadoop已经成为云计算软件的一个事实标准,以及开源云计算解决方案的几乎唯一选择。对于想用低成本(包括软硬件)实现云计算平台或海量数据分析平台的用户,Hadoop集群是首选的对象。由于Hadoop在各方面都打破了传统关系型数据库的思路和模式,对于新接触Hadoop平台的人,往往会觉得困惑和难以理解,进而转化为畏惧。
    因此,为了赶上大数据时代的发展,迎接云计算的思维,尽管我做的是.NET的应用开发工作,但我仍然选择业余时间学习Hadoop。我会从Hadoop1.x版本开始学习经典的HDFS与MapReduce,然后了解Hadoop2.x版本与老版本的差异,熟悉一些常见的Hadoop应用场景,并学着实践一个最经典的项目(网站日志数据分析案例)来完成我给自己规划的学习任务。
二、Hadoop笔记系列索引
2.1 基础环境部分:
  (1)基础介绍与环境搭建:http://www.iyunv.com/edisonchou/p/3485135.html
  (6)Hadoop Eclipse插件的使用:http://www.iyunv.com/edisonchou/p/4297521.html
  (13)分布式集群中节点的动态添加与下架:http://www.iyunv.com/edisonchou/p/4302477.html
2.2 HDFS部分:
  (2)不怕故障的海量存储之HDFS基础入门:http://www.iyunv.com/edisonchou/p/3538524.html
  (3)Hadoop RPC机制的使用:http://www.iyunv.com/edisonchou/p/4285817.html
2.3 MapReduce部分:
  (4)初识MapReduce:http://www.iyunv.com/edisonchou/p/4287784.html
  (5)自定义类型处理手机上网日志:http://www.iyunv.com/edisonchou/p/4288737.html
  (7)计数器与自定义计数器:http://www.iyunv.com/edisonchou/p/4297599.html
  (8)Combiner与自定义Combiner:http://www.iyunv.com/edisonchou/p/4297786.html
  (9)Partioner与自定义Partitioner:http://www.iyunv.com/edisonchou/p/4297828.html
  (10)Reduce阶段中的Shuffle过程:http://www.iyunv.com/edisonchou/p/4298423.html
  (11)MapReduce中的排序和分组:http://www.iyunv.com/edisonchou/p/4299085.html
  (12)MapReduce中的常见算法:http://www.iyunv.com/edisonchou/p/4299950.html
2.4 ZooKeeper部分:
  (14)ZooKeeper环境搭建:http://www.iyunv.com/edisonchou/p/4303031.html
2.5 HBase部分:
  (15)HBase框架学习之基础知识篇:http://www.iyunv.com/edisonchou/p/4405442.html
  (15)HBase框架学习之基础实践篇:http://www.iyunv.com/edisonchou/p/4405906.html
2.6 Pig部分:
  (16)Pig框架学习:http://www.iyunv.com/edisonchou/p/4413347.html
2.7 Hive部分:
  (17)Hive框架学习:http://www.iyunv.com/edisonchou/p/4426096.html
2.8 Sqoop部分:
  (18)Sqoop框架学习:http://www.iyunv.com/edisonchou/p/4440216.html
2.9 Flume部分:
  (19)Flume框架学习:http://www.iyunv.com/edisonchou/p/4445491.html
2.10 项目实战部分:
  (20)网站日志分析项目(一)项目介绍:http://www.iyunv.com/edisonchou/p/4449082.html
  (20)网站日志分析项目(二)数据清洗:http://www.iyunv.com/edisonchou/p/4458219.html
  (20)网站日志分析项目(三)统计分析:http://www.iyunv.com/edisonchou/p/4464349.html
2.11 Hadoop2部分:
  (21)Hadoop2的改进内容简介:http://www.iyunv.com/edisonchou/p/4470682.html
  
  

  作者:周旭龙
  出处:http://www.iyunv.com/edisonchou/
  本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文链接。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-85574-1-1.html 上篇帖子: Hadoop 常见错误汇总 (转载) 下篇帖子: Hadoop 2.4.1 设置问题小结【原创】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表