设为首页 收藏本站
查看: 727|回复: 0

[经验分享] 浅谈Hadoop下HDFS文件系统

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2014-12-9 09:16:19 | 显示全部楼层 |阅读模式
Hadoop下HDFS文件系统
    在这里我们对Hadoop的基本概念,历史功能就不做过多的阐述,重点在对于他的文件系统做一些了解和阐述。
     HDFS(Hadoop distributed file system)是一个分布式文件系统。具有高容错性(fault-tolerant),使得他能够部署在低廉的硬件上。他可以提供高吞吐率来访问应用程序的数据。HDFS放宽了可移植操作系统接口的要求。这样就可以实现以流式的形式来访问文件系统的数据。
     HDFS的设计目标:
  • 检测和快速回复硬件故障
  • 流式的数据访问
  • 简化一致性模型
  • 通信协议

    HDFS体系结构
QQ截图20141209091408.jpg
HDFS的体系结构采用主从(Master/Slave)模型,一个HDFS集群是由一个NameNode和若干个DataNode组成,其中NameNode是主服务器,管理文件体统的命名空间和文件操作;DataNode管理存储的数据。HDFS允许用户以文件的形式来存储数据。从内部来看文件被分成了若干个数据块,而这若干个数据块存储在一组DataNode中。在NameNode的统一调度下课以对文件进行创建、删除和复制。(用户数据永远不会经过NameNode)
  Hadoop与分布式开发
我们通常所说的分布式系统其实是分布式软件系统,即分布式处理的软件系统,包括
分布式操作系统
分布式程序设计语言及其编译(解释)系统
分布式文件系统
分布式数据库系统
Hadoop属于分布式软件系统中的文件系统中这一层它实现了分布式文件系统和部分分布式数据库的功能
  而区中HDFS能够实现数据在据算计集群组成的云上高效的存储和管理。
HDFS分布式系统和其他系统的类似特质:
  • 对于整个集群有的那一的命名空间
  • 具有数据的一致性、适合一次写入多次读写的模型,客户端在文件没有被成功创建之前,是无法看到文件的存在
  • 文件会被分成多个问价块,每个文件被分配存储到数据节点上,而且会根据配置有复制文件块来保证数据的安全性。

接下来请根据上图参考学习
通过具体的操作来看HDFS对数据的管理
(1)文件写入
  • Client向NameNode发起文件写入的请求
  • NameNode根据文件大小和文件块的配置情况,返回给client他所管理的DataNode的信息
  • client将文件划分为多个Block,根据DataNode的地址信息,按顺序将其写入每一个DataNode块中

(2)文件读取
  • client向NameNode发起读取文件的请求
  • NameNode返回文件存储的DataNode信息
  • client读取文件信息

(3)文件块(Block)复制
  • NameNode发现部分文件的Block不符合最小复制数这一要求或部分DataNode失效
  • 通知DataNode相互复制Block
  • DataNode开始直接相互复制

HDFS在系统管理值得借鉴的功能
  • 心跳检测
  • 数据复制
  • 数据校验
  • 单个NameNode如果失败任务处理信息将会记录在本地文件系统和远端的文件系统中
  • 数据的管道性写入
  • 安全模式

HDFS就简单介绍到这  如果有不足的地方请多多包涵,该文档仅作学习参考。


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-37646-1-1.html 上篇帖子: Apache Hadoop* 软件的英特尔? 分发版环境搭建 下篇帖子: Mahout进阶课程|Mahout视频教程免费下载
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表