设为首页 收藏本站
查看: 1494|回复: 0

[经验分享] postgresql集群方案hot standby初级测试(三)——蛋疼测试——手动同步数据

[复制链接]

尚未签到

发表于 2016-11-21 07:30:40 | 显示全部楼层 |阅读模式
  最近也做了很多关于集群方面的测试,但是公司又有这样一个需求:
  
  当集群搭建好后,如果主节点意外死亡,我们希望从节点能够当做主节点重新启动,这样不影响客户端的操作,或者只受短时间影响。
  
  此时的我,有种蛋蛋的忧伤,“对于程序员,需求神马的最讨厌了”。无奈之下看了原理,并做了基础测试。
  
  本文来自:http://blog.csdn.net/lengzijian/article/details/7736961
  
  在之前我们模拟过集群遇到的几种状况,其中有一种,当客户端发送数据时,强行kill掉主库所有进程,导致主库和从库的数据不同步,但是当重启主库后,从库会拉数据回来,之后同步数据。(http://blog.csdn.net/lengzijian/article/details/7729380)
  
  问题就在于如果主库不启动,我们如何同步数据?
  
  在分析了原理后,发现主库进程中有这样一个进程
  wal sender process postgres192.168.30.199(33121) streaming 0/424993E0
  听名字就像是专门服务发送wal日志的进程,并且后面写出了从库的ip,这使得我非常确认它是负责主库和从库的数据同步的。
  
  之后我冒出了一个想法:自己传输wal日志。查看是否能够达到预期的效果。
  
  1.先搭建hotstandy集群,这次只用一主一从;
  2.运行插入数据库脚本:1个线程100000数据;
  脚本和用法在http://blog.csdn.net/lengzijian/article/details/7729465中提供
  3.kill-9掉主库所有postgress进程;
  
  查看插入脚本报错信息:
DSC0000.jpg

  文中16586为插入失败的位置;
  
  查看从库数据量:
DSC0001.jpg

  关键时刻开始
  4.查看从库xlog文件夹
   DSC0002.jpg
  5.查看主库xlog文件夹
   DSC0003.jpg
  6.查看主库xlog/archive_status文件夹
  
   DSC0004.jpg
  7.发现xxx41号文件已经处理完成,xxx42号文件还未处理完成,那么我们对比从库xlog文件可以认为42号尚在传输过程中被终端,再看从库的4344的时间不符和逻辑可以直接删除。我们可以直接把主库的42号文件复制到从库里。
  删除从库无用数据
   DSC0005.jpg
  复制主库42号文件到从库
   DSC0006.jpg
  
  8.查看从库数据量:
   DSC0007.jpg
  9.可以看到与之前的错误日志数字相符(可能有同学会注意到,相差1个数,主要原因可能是插入成功后,断开连接报错,这里本人做了不下3次的试验,结果均正常)
  
  10.启动主库查看数据是否同步:主库的数据量如下
   DSC0008.jpg
  11.可以看到与之前回复的数据总量一样,oh~~~~~开心,有些人可能要喷本人了,因为懂原理之后,这些都是正常情况!!本人的态度正如本片文章标题一样,宁可去做十几遍的尝试,要不想要小概率的时间发生在我的服务器上(简称:“蛋疼”)
  
  这里需要注意的是:
  
  如何判断那些xlog文档是已经同步过的,那些事没有同步的?
  这里写下我多次测试后的经验,在主库的xlog/archive_status中,带.done后缀的文件仅表示主库中已经归档完成的,不代表已经发送给从库的;在从库中存在一些混淆的日志文件,例如之前我们删掉的4344,判断无效的依据是根据时间和文件名,有些文件明显不是刚刚操作过的。删掉了混淆的文件后便可以恢复编号最大的文件了(如果怕错误,也可以多恢复一些文件)。如果实在不懂,可以联系本人
  
  有了如上经验,我们可以自己写脚本拉数据,并且启动从节点为主节点方式(目前是本人推测,还未真实实验),如果有任何疑问或者本文中存在错误,可以随时联系本人O(∩_∩)O哈哈~。
  

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-303112-1-1.html 上篇帖子: postgresql集群方案hot standby初级测试(四)——xlog详细解释header 下篇帖子: postgresql集群方案hot standby初级测试(二) ——处理数据能力
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表