设为首页 收藏本站
查看: 693|回复: 0

[经验分享] Hadoop HA 学习

[复制链接]

尚未签到

发表于 2015-7-13 10:28:10 | 显示全部楼层 |阅读模式
  Hadoop HA是一个非常需要重视的问题。众所周知,Haddop是一个SPOF(single point of failure)系统,存在单点问题。对于7×24生产环境,是具有极大的风险。
  目前社区版的做法是有两种保障机制,第一种是可以设置一个NFS的目录,存储fsimage和editlog,存储的是实时数据,这样当namenode挂掉后能够通过fsimage和editlog进行完全恢复。第二种是设置secondary namenode,名称很迷惑,但其作用是对fsimage和editlog进行定期的merge,默认是5分钟,所以获得的数据是过期的,存在数据丢失,但是能够恢复大部分数据。
  对于生产集群来说,很多操作不能够停止太长时间。而对于上面两种方式,即使能够恢复数据,重新将namenode上线,在经过datanode的blockReport过程,需要很长时间。相同的问题也出现在打patch上,如果对datanode打patch影响还不是很大,可以一台一台打patch,即使下线一台datanode,数据的多份拷贝不会丢失,client可以通过与namenode通信获得其它的副本对应的datanode的位置,整体的服务没有停止。但是如果对于namenode打patch,就需要停止整体服务,重新上线后会等待大量时间在datanode的blockReport上。根据facebook的一篇文章,他们重新启动12PB的数据的集群需要大概半个小时。
  Facebook的做法是在不改变namenode和datanode整体逻辑的基础上,在其上层开发出AvaterNode,AvatarNode的意思就是支持互相切换,就像人可以切换Na'vi族人,也可以切换过来一样。他们的做法是提供一个Primary Avatar和一个Standby Avatar,通过virual IP来设置IP地址。Primary Avatar对外提供服务,设置了NFS目录,将FSImage和EditLog远程存储。Standby Avatar将NFS目录中的FSImage和EditLog读取过来进行同步,并且设置Standby Avatar一直处于safemode状态,不影响正常操作。这样Standby Avatar相当于一个热拷贝,获得了所有的实时数据。在Datanode部分也进行了封装,所有Datanode都像两个Namenode汇报,保证数据的实时性。这样,当Primary Avatar下线后,通过操作可以迅速让Standby Avatar切换为Primary Avatra上线。时间在分钟级,并且不需要重启。
  同时还稍微看了一下中移动写的他们的NNC集群,采用的是在一个Namenode上插入Deamon,将每个操作同步到slave namenode中。看起来性能应该会下降很多,他们也没有提供数据。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-86208-1-1.html 上篇帖子: Hadoop的shuffle过程 下篇帖子: java hadoop file system API
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表