设为首页 收藏本站
查看: 811|回复: 0

[经验分享] Hadoop 2.x HDFS新特性

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2014-11-26 08:43:44 | 显示全部楼层 |阅读模式
  • HDFS联邦
  • HDFS HA
  • HDFS快照

回顾: HDFS两层模型
  • Namespace: 包括目录,  文件和块.  它支持所有命名空间相关的文件操作, 如创建,  删除,  修改, 查看所有文件和目录
  • Block Storage Service (块存储服务) 包括两部分

1. 在namenode中的块的管理
提供datanode集群的注册, 心跳检测等功能.
处理块的报告信息和维护块的位置信息
支持块相关的操作, 如创建, 删除, 修改, 获取块的位置信息.
管理块的冗余信息, 创建副本, 删除多余的副本等.
2. 存储: datanode提供本地文件系统上块的存储, 读写, 访问等.

1.x HDFS架构的弱点
HDFS架构在整个集群中允许且仅运行一个单独的命名空间. 命名空间被一个单独的namenode节点所管理. 这种架构决策实现简单. 单页会产生单点, 内存瓶颈, 性能瓶颈等限制
也许仅仅在像Yahoo和Facebook这种规模的公司才会面对这样的限制问题, 但这些限制在2. x HDFS联邦中被解决
http://blog.iyunv.com/strongerbit/article/details/7013221

多namenode及namespaces体系
注意 "联邦" 这个政治术语的含义(不是ha的概念)
目的: 水平扩展名称服务
使用多个独立的namenode和namespaces. 每个namenode是独立的, 不需要和其他namenode协调合作
datanode作为统一的块存储设备被所有namenode节点使用
每一个datanode节点都在所有的namenode进行注册. datanode发送心跳信息, 块报告收到所有namenode, 同时执行所有namenode发来的命令

块池(Block Pool)
块池是属于单个命名空间的一组块
每一个datanode为所有的block pool存储块
Datanode是一个物理概念, 而block pool 是一个重新将block划分的逻辑概念
同一个datanode中可以存着属于多个block pool的多个块
Block pool允许一个命名空间在不通知其他命名空间的情况下为一个新的block创建Block ID
一个Namenode失效不会影响其下的datanode为其他的Namenode的服务.

好处
Namespace的可扩展性, 1.x中集群存储可以水平扩展(增加节点), 但namespace不可以
1.x 的Namenode存在单点瓶颈, 在2.x 中可以通过增加 namenode 解决
隔离性, 在 1.x中, 一个不好的应用可能耗尽namenode的性能资源从而影响其他应用运行, 2.x的多namenode可以将不同类型的应用和用户隔离在不同的namespaces

命名空间管理细节
不采用文件名hash这一在分布式系统里常用的手段, 因为同一目录下的文件可能散布于各个命名空间, 性能很差
采用Client Side Mount Table

未解决的问题
并非真正HA, namenode失效会造成部分数据无法访问
负载均衡难以自动完成


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-33740-1-1.html 上篇帖子: Hadoop的HDFS-javaapi 下篇帖子: Hadoop 2.x 联邦配置
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表