prollerweg 发表于 2018-10-7 07:04:59

【MySQL】 已经存在大量数据的表做分区

  环境:
  数据库版本:5.6
  系统环境:CentOS 6.8
  复制架构:

  需求:
  需要将实例C上面一个2500万行数据的Innodb引擎的表table进行分区,但是在实例A上面表table不做任何的修改。
  思考的问题:
  在实例C上面的表table做分区,分区之后会不会影响实例A和实例C之间表table的传输,会不会造成数据不一致或者插入失败,或者分区之后插入的数据会比较慢。
  实际操作:都是在实例C上面的操作
  1. stop slave IO_THREAD 停掉IO_THREAD并且等待实例C重放relay log完毕。
  Master_Log_File == Relay_Master_Log_File andRead_Master_Log_Pos == Exec_Master_Log_Pos 当这俩个表达式成立的时候表明本地的relay log已经重做完毕。
  2.逻辑备份表table的数据:
mysqldump -S /var/lib/mysql/mysql.sock -uroot -p --single-transaction --master-data=2 -t --skip-add-drop-table sbtest sbtest1 > sbtest1.sql  
参数解释:
  
-t:不创建table
  
--skip-add-drop-table:不做drop table操作
  在备份的时候不需要drop table 和 create table操作写入备份的SQL语句中
  3.更改表名
  更改旧表的表名 rename table sbtest1 to sbtest2; 这样做的目的是为了在做备份导入的时候不需要更改备份SQL语句,并且万一分区失败或者其他的原因至少也有表的备份存在。
  4.创建空表并且进行分区:
CREATE TABLE `sbtest1` (  
`id` bigint(20) NOT NULL AUTO_INCREMENT,
  
`k` bigint(20) NOT NULL,
  
`c` varchar(20) NOT NULL,
  
`pad` varchar(50) COLLATE utf8mb4_bin NOT NULL,
  
PRIMARY KEY (`id`)
  
) ENGINE=InnoDBDEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin PARTITION BY KEY (id) PARTITIONS 64
  新表的表结构要和旧表的表结构一致,唯一不同就是提前分好区。
  5.导入逻辑备份语句
mysql -uroot -p sbtest < sbtest1.sql  6.导入完毕之后开启slave并且观察一段时间
start slave IO_THREAD  7.pt-table-checksum数据一致性检测(可做可不做)
  http://seanlook.com/2015/12/29/mysql_replica_pt-table-checksum/
  8.建议:
  因为2500万行的数据的备份会花费比较长的时间,所以在备份的时候建议使用screen,那怕在你远程回话断开之后进程还是存在的。


页: [1]
查看完整版本: 【MySQL】 已经存在大量数据的表做分区