设为首页 收藏本站
查看: 761|回复: 0

[经验分享] 初始HDFS(hadoop distributed file system)

[复制链接]

尚未签到

发表于 2016-12-10 10:45:22 | 显示全部楼层 |阅读模式
初次接触HDFS(Hadoop Distributed File System),主动或者被动地了解一些相关知识,也有同事给我们分享过,但是大多是一些概念把我们唬住了,很难有个清晰的认识和进一步了解的前提,借此论坛的机会,整理一点,我想可以轻松愉快的快速认识一下HDFS。”


DSC0000.png


影片名称:HDFS分布式文件系统

上映时间:2004年X月,至今翻拍多版

主要演员:client、namenode、datanode

编剧导演:Doug Cutting等

发行方式:Open开源

发行机构:Apache

影片语言:Java

影片类型:科技教育动漫

影迷评分:7.9分/

相关影片:GFS、HBASE、MAPREDUCE、HIVE、PIG、ZOOKEEPER等

影片简介:HDFS是Hadoop生态系统的一员,意思如同名称分布式文件系统……

◆影片开始,都会列出主要演员(The Cast)


DSC0001.png


客户端:对HDFS的操作都要通过我,你们别指望越过我,其他人不会搭理你;

元数据节点:我是独一无二的,当然除了我的备胎(我要是死了,备胎就是我,等我复活以后,我就变成备胎了),这里的事情都要协调,看出来了吧,我是主角;

数据节点:我们,我们是存储数据用的,我们是群众演员,一般都是有很多的,我们可以死,但是也不能死太多;

◆正式故事(第一节),向HDFS里面写数据(Writing Data In HDFS Cluster)

○用户请求(Request From User)

DSC0002.png



○数据块和拷贝(Block And Replaction)

DSC0003.png



○切割文件成块(Divide File Into BLocks)


DSC0004.png


○询问元数据节点(Ask NameNode)


DSC0005.png


○元数据节点选用数据节点(NameNode Assigns DataNodes)


DSC0006.png


○客户端开始写数据(Client Starts Writing Data)


DSC0007.png


○通知元数据节点操作完成(Infrom NameNode When Done)

DSC0008.png





○全部数据块写完(When All Blocks Are Written)


DSC0009.png


○正式故事(上)扼要重述(Rcap)


DSC00010.png


◆正式故事(第二节),从HDFS中读取数据(Reading Data From HDFS Cluster)

○用户请求(Request From User)

DSC00011.png



○首先联系元数据节点(Contact NameNode First)

DSC00012.png



○下载数据(DownLoad Data)

DSC00013.png



◆正式故事(第三节),HDFS容错性能

○错误类型和检错(Types Of Faults And Their Detection)

错误一:节点错误


DSC00014.png


错误二:通讯错误

DSC00015.png



错误三:数据错误

DSC00016.png



检错一:节点错误

DSC00017.png



检错二:网络错误


DSC00018.png


检错三:数据错误


DSC00019.png




○处理数据读写错误(Handling Reading And Writing Failures)

处理写数据错误


DSC00020.png




处理读数据错误


DSC00021.png




○处理节点错误


DSC00022.png






◆正式故事(第四节),拷贝的位置策略(Replica Placement Strategy)





○机架和数据节点(Racks and DataNode)

DSC00023.png



○选择第一个拷贝位置(Selecting First Replica Location)


DSC00024.png


○剩下两个拷贝位置(Next Two Replica Location)


DSC00025.png


○后来的拷贝所放位置(Subsquent Replica Locations)

DSC00026.png


  



◆后记(Where to go From here?)

DSC00027.png



HDFS分布式文件系统介绍完了,是不是感觉像放电影一样,我想看完后,你对HDFS一定有一个大概认识,貌似也不是很困难,不过这只是个开始,我也是在网上找到这幅漫画的,分享给大家,希望可以让你对学习Hadoop提供一点信心吧,愉快的学习,我们知道公司和客户都在推进各个系统的云化工作,我想这些东西以后也是我们必备的知识吧。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-312294-1-1.html 上篇帖子: hadoop培训课程的授课技巧 下篇帖子: 理解Hadoop-Hbase原理与应用小结
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表