设为首页 收藏本站
查看: 739|回复: 0

[经验分享] mysql主从同步故障及解决过程

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2016-1-8 08:59:54 | 显示全部楼层 |阅读模式
公司里有两个mysql服务器做主从同步,某天Nagios发来报警短信,mysqla is down...赶紧联系机房,机房的人反馈来的信息是 HARDWARE ERROR 后面信息省略,让机房记下错误信息后让他们帮忙重启下看是不是能正常起来,结果竟然正常起来了,赶紧导出所有数据。

      问题又出现了,nagios 又报警,mysql_AB error,检查从库
  show slave status \G; 果然
  Slave_IO_Running: Yes
  Slave_SQL_Running: No
  而且出现了1062错误,还提示
  Last_SQL_Error: Error 'Duplicate entry '1001-164761-0' for key 'PRIMARY'' on query. Default database: 'bug'. Query: 'insert into misdata (uid,mid,pid,state,mtime) values (164761,1001,0,-1,1262623560)'
  很显然,由于主库重启导致 从库数据不同步而且主键冲突。查看error 日志发现error日志文件变得好大,比以前大了将近好几倍,
  tail -f mysql_error.log 最开始查看到的是这条信息
  发现这条信息
  [ERROR] Slave SQL: Error 'Duplicate entry '1007-443786-0' for key 'PRIMARY'' on query. Default database: 'ufo'. Query: 'insert into misdata (uid,mid,pid,sta
  te,mtime) values (443786,1007,0,-1,1262598003)', Error_code: 1062
  100104 17:39:05 [Warning] Slave: Duplicate entry '1007-443786-0' for key 'PRIMARY' Error_code: 1062
  100104 17:39:05 [ERROR] Error running query, slave SQL thread aborted. Fix the problem, and restart the slave SQL thread with "SLAVE START". We stopped at log 'ufolog.000058
  8' position 55793296
  报错和上面的意思差不多,
  最先想到的就是首先手动同步一下,从库上首先 stop slave;停止同步
  进入主库锁表,
  FLUSH TABLES WITH READ LOCK;
  mysql> show master status;
  +-------------------+-----------+--------------+------------------+
  | File | Position | Binlog_Do_DB | Binlog_Ignore_DB |
  +-------------------+-----------+--------------+------------------+
  | ufo.000063 | 159164526 | | |
  +-------------------+-----------+--------------+------------------+
  1 row in set (0.00 sec)
  进入从库
  mysql>change master to master_host='192.168.1.141', master_user='slave',
  master_password='xxx',
  master_port=3306,
  master_log_file='ufo.000063',
  master_log_pos=159164526;
  完成上面这些后
  start slave;
  回到主库
  unlock tables; 解锁
  回到从库 查看
  show slave status \G;
  发现正常了,长处了一口气。可是还没过一分钟,发现又开始报错了,还是最开始那个错误,这是怎么回事...
  于是又想到了跳过错误的办法,(不过我不太喜欢用这种方法)马上进入从库
  stop slave;
  set global sql_slave_skip_counter=1; (1是指跳过一个错误)
  slave start;
  再show slave status \G;查看
  还是报错 只不过 原来的 164761 变成了 165881,连续执行了几次后
  除了上面的数值 在变,错误依然还在
  郁闷了,看来只能先强制跳过 1062错误了,于是修改从库的/etc/my.cnf文件
  在里面的[mysqld]下面加入了一行
  slave-skip-errors = 1062 (忽略所有的1062错误)
  重启下从库的mysql /etc/init.d/mysqld restart
  再 show slave status \G;一下发现正常了,但是我知道这时的数据可能已经不同步了,
  再次查看一下日志,让我感到意外的是tail -f mysql_error.log 出现大量的
  .......
  100106 16:54:21 [Warning] Statement may not be safe to log in statement format. Statement: delete from `system_message_1` where `to_uid` = 181464 ORDER BY `id` ASC LIMIT 1
  .........
  日志里面有大量的这种警告,意思应该是statement 格式不安全,用vim 打开他看了一下,发现好多这类警告,我说为什么错误日志怎么变这么大了呢!!
  statement format 应该是 binlog的一种格式,进入从库查看一下
  show global variables like 'binlog_format';
  果然当前的格式为statement
  我需要把格式改为 mixed格式
  修改从库的 my.cfg
  在[mysqld]下面加入下面这行
  binlog_format=mixed
  然后重启mysql服务,发现错误日志里的 警告 都停止了。这回清静多了~~
  我突然想起一件事,记得有朋友说过 RBR 模式可以解决很多因为主键冲突导致的主从无法同步情况,想到这里我就想要不要把 slave-skip-errors = 1062 去掉再试试,
  于是就进入到my.cnf 里在注释掉了 slave-skip-errors = 1062
  再次重新启动 mysql服务
  进入从库
  show slave status \G;
  .........
  Slave_IO_Running: Yes
  Slave_SQL_Running: Yes
  ........
  恢复了!!!有观察了一段时间没有出现问题这才放心,
  看来导致 mysql 主从复制出错的原因还真不少修复的办法也不止一个,binlog的格式也是其中之一。


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-161676-1-1.html 上篇帖子: mysql查看数据库状态show status 下篇帖子: mysql 统计函数和group by mysql
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表