设为首页 收藏本站
查看: 588|回复: 0

[经验分享] 小朱笔记之hadoop应用实战、源码分析-目录

[复制链接]

尚未签到

发表于 2016-12-10 10:49:48 | 显示全部楼层 |阅读模式
小朱笔记之hadoop应用实战、源码分析
 
1.1 背景目的
       该笔记从宏观架构、安装配置、源码分析、使用案例四个方面剖析了Hadoop1.0.3,希望能对同学们提供帮助,赠人玫瑰,手留余香。能够把hadoop理论、源码和实践结合起来的资料少之又少,作者历时近一年搜集各种相关资料,取其精华,并经过实践检验。鉴于个人对于云计算的理解非常的浅薄,缺少足够的实践经验,深入的问题就不班门弄斧了,仅做梳理和解析。特别感谢李大嘴、奔跑的羚羊、觉先、阿笨猫、逸情公子、heyutao007、caibin、彭帅、千与、zhangyu8374、庄周梦蝶等同学,从你们探索的资料中,我学习了很多东西,受益匪浅。再次感谢!另外我的学习源码(内含大量注释和分析)将会分享给大家下载。

     另外mapreduce模块,我这边最近比较忙,很难尽快发布。有同学感兴趣的话,可以加我好友,大家一起分析。谢谢!

1.2 读者范围
      读者需对hadoop有一定的了解,如果读者想只是想从原理上更加深入Hadoop 原理以及运行机制的话,只需要阅读第1、2章综述即可。如果读者想深入Hadoop的源码,则需阅读该文档第3-7章。读者熟练掌握Java语言的基本语法,并且对反射机制、动态代理、网络通讯有一定的了解。
             官方源码svn地址:http://svn.apache.org/repos/asf/hadoop/common/tags/release-1.0.3
             注意:目前线上集群已经全部升级为hadoop-branch-2.2.0,所以小朱就hadoop 2.2版本也一并做分析。
1.3 目录安排
下面是小朱笔记-hadoop系列目录安排,希望大家的关注,并提出建议或意见。
备注:绿色(已发布)、蓝色(已写完)、橙色(正在写)、黑色(没有写)
 第一章:环境配置以及集群部署
第一节.集群环境配置
第二节.开发环境配置
第三节.实用工具配置
 
第二章:脚本分析
第一节:start-all.sh
第二节:hadoop-config.sh
第三节:hadoop-env.sh
第四节:start-dfs.sh
第五节:hadoop-daemon.sh
第六节:hadoop-daemons.sh
第七节:slaves.sh
第八节:start-mapred.sh
第九节:hadoop
 
第三章:io分析
 
第四章:conf分析
第一节:Configurable类分析
第二节:Configured类分析
第三节:Configuration类分析
 
第五章:ipc分析
第一节:RPC协议
第二节:Client类分析
第三节:Server类分析
第四节:RPC类分析
 
第六章:hdfs分析
第一节:基本概念
        
第二节:fs抽象文件系统实现
            2.1 cache机制
            2.2 statisticsTable统计信息管理映射表
            2.3 deleteOnExit临时文件集合
            2.4 文件系统抽象
            2.5 文件操作
            2.6 重要数据结构
第三节:hdfs实现分析
            3.1 基本概念
            3.2 通讯协议
            3.3 namenode数据结构
            3.4 datanode数据结构
            3.5 SecondaryNameNode数据结构
            3.6 DFSClient数据结构
第四节:namenode专项分析
            4.1 namenode启动过程分析
            4.2 namenode format过程分析
            4.3 namenode 副本监控分析ReplicationMonitor
            4.4 namenode文件租约分析LeaseManagerMonitor
            4.5 namenode心跳检测分析HeartbeatMonitor
            4.6 namenode任务线程之DecommissionManager$Monitor
            4.7 namenode 安全模式SafeModeMonitor
            4.8 回收站机制
第五节:Datanode 专项分析
            5.1 Datanode 启动过程分析
            5.2 Datanode 心跳分析
            5.3 Datanode 注册分析
            5.4 DataBlockScanner 文件校验
            5.5 DataNode 数据读写分析
第六节:SecondaryNameNode专项分析
            6.1 架构分析
            6.2 SecondaryNameNode启动过程分析
            6.3 Checkpoint分析
            6.4 Import Checkpoint恢复数据
第七节: 客户端专项分析

第八节:系统升级分析

第九节:block Recovery过程分析

第十节:数据负载均衡分析

第十一节:机架感知策略分析
 
第七章:mapreduce分析
 
第八章:scheduler分析
 
第九章:security分析
 
 
第十章:应用案列以及解决方案
 
第一节:hadoop hdfs 运维优化
第二节:hadoop mr    开发优化
第三节:hadoop namenode HA探索
第四节:hadoop jobtracker  HA探索

作者简介:
朱辉    目前为彩票168网CTO/彩票365网技术经理。曾就职于彩洋洋网、人人网。多年互联网从业经验和程序开发,对分布式系统的开发、高并发、大数据量网站系统架构优化,高可用性、可伸缩性、分布式系统缓存设计,云计算hadoop&hive运维以及大数据分析等有丰富的经验。
QQ:46580583 只因程序夜未眠。
 

 
 

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-312303-1-1.html 上篇帖子: 用protobuf替换hadoop中rpc的返回值 下篇帖子: 数据分析不使用Hadoop的五大理由(转)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表