使用Percona Toolkit解决Mysql主从不同步问题【备忘】

由于各种原因,mysql主从架构经常会出现数据不一致的情况出现,大致归结为如下几类

  • 1:备库写数据
  • 2:执行non-deterministic query
  • 3:回滚掺杂事务表和非事务表的事务
  • 4:binlog或者relay log数据损坏

数据不同步给应用带来的危害是致命的,当出现主从数据不一致的情况,常见的应对方法是先把从库下线,然后找个半夜三更的时间把应用停掉,重新执行同步,如果数据库的体积十分庞大,那工作量可想而知,会让人崩溃。本文介绍使用percona-toolkit工具对mysql主从数据库的同步状态进行检查和重新同步。

一:安装percona-toolkit

  1. # yum -y install perl-Time-HiRes 
  2. # wget 
  3. http://www.percona.com/downloads/percona-toolkit/2.2.13/tarball/percona-toolkit-2.2.13.tar.gz 
  4. # tar -zxvpf percona-toolkit-2.2.13.tar.gz 
  5. # cd percona-toolkit-2.2.13 
  6. # perl Makefile.PL 
  7. # make 
  8. # make install 

二:修改mysql 的binlog格式binlog_format参数为row格式

mysql binlog日志有三种格式,分别为Statement, Mixed,以及ROW!

1.Statement:

每一条会修改数据的sql都会记录在binlog中。

优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO,提高性能。(相比row能节约多少性能与日志量,这个取决于应用的SQL情况,正常同一条记录修改或者插入row格式所产生的日志量还小于Statement产生的日志量,但是考虑到如果带条件的update操作,以及整表删除,alter表等操作,ROW格式会产生大量日志,因此在考虑是否使用ROW格式日志时应该跟据应用的实际情况,其所产生的日志量会增加多少,以及带来的IO性能问题。)

缺点:由于记录的只是执行语句,为了这些语句能在slave上正确运行,因此还必须记录每条语句在执行的时候的一些相关信息,以保证所有语句能在slave得到和在master端执行时候相同 的结果。另外mysql 的复制,像一些特定函数功能,slave可与master上要保持一致会有很多相关问题(如sleep()函数, last_insert_id(),以及user-defined functions(udf)会出现问题).

2.Row

不记录sql语句上下文相关信息,仅保存哪条记录被修改。

优点: binlog中可以不记录执行的sql语句的上下文相关的信息,仅需要记录那一条记录被修改成什么了。所以rowlevel的日志内容会非常清楚的记录下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题

缺点:所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容,比如一条update语句,修改多条记录,则binlog中每一条修改都会有记录,这样造成binlog日志量会很大,特别是当执行alter table之类的语句的时候,由于表结构修改,每条记录都发生改变,那么该表每一条记录都会记录到日志中。

3.Mixed

是以上两种level的混合使用,一般的语句修改使用statment格式保存binlog,如一些函数,statement无法完成主从复制的操作,则采用row格式保存binlog,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择一种.新版本的MySQL中队row level模式也被做了优化,并不是所有的修改都会以row level来记录,像遇到表结构变更的时候就会以statement模式来记录。至于update或者delete等修改数据的语句,还是会记录所有行的变更。

主从数据库分别修改my.cnf文件相关配置项如下:

  1. binlog_format=ROW

 

三:使用pt-table-checksum工具检查数据一致性情况

用法参考:

假设192.168.1.205是主库,192.168.1.207是它的从库,端口在3306。

1. 先校验

  1. # pt-table-checksum --user=root --password=123456 \ 
  2. --host=192.168.1.205 --port=3306 \ 
  3. --databases=test --tables=t2 --recursion-method=processlist \ 
  4. --no-check-binlog-format --nocheck-replication-filters \ 
  5. --replicate=test.checksums 

2. 根据校验结果,只修复192.168.1.207从库与主库不一致的地方:

  1. # pt-table-sync --execute --replicate \ 
  2. test.checksums --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456 

3. 修复后,再重新校验一次。执行第一步的语句即可。

4. 检查修复结果: 登陆到192.168.1.207,执行如下sql语句返回若为空,则说明修复成功:

  1. SELECT 
  2. FROM 
  3. test.checksums 
  4. WHERE 
  5. master_cnt <> this_cnt 
  6. OR master_crc <> this_crc 
  7. OR ISNULL(master_crc) <> ISNULL(this_crc) 

各参数含义

  • --nocheck-replication-filters:不检查复制过滤器,建议启用。后面可以用--databases来指定需要检查的数据库。
  • --no-check-binlog-format:不检查复制的binlog模式,要是binlog模式是ROW,则会报错。
  • --replicate-check-only:只显示不同步的信息。
  • --replicate=:把checksum的信息写入到指定表中,建议直接写到被检查的数据库当中。
  • --databases=:指定需要被检查的数据库,多个则用逗号隔开。
  • --tables=:指定需要被检查的表,多个用逗号隔开
  • h=127.0.0.1:Master的地址
  • u=root:用户名
  • p=123456:密码
  • P=3306:端口

 

下面我们来模拟下主从数据库不同步情况下的pt-table-checksum,为了方便,这里我们采用test schema

1: 主库上建表,插入测试数据

  1. mysql> create table t2 (id int primary key,name varchar(100) not null,salary int); 
  2. mysql> CREATE PROCEDURE test_insert () 
  3. BEGIN 
  4. DECLARE i INT DEFAULT 0; 
  5. WHILE i<10000 
  6. DO 
  7. INSERT INTO t2 
  8. VALUES 
  9. (i,CONCAT('员工',i), i); 
  10. SET i=i+1; 
  11. END WHILE ; 
  12. END;; 
  13. mysql> CALL test_insert(); 

从库上校验当前数据的同步情况为正常。

从库上删除一半的数据

  1. mysql> delete from t2 where id > 5000; 
  2. Query OK, 4999 rows affected (0.14 sec) 
  3.  
  4. mysql> select count(*) from t2; 
  5. +----------+ 
  6. | count(*) | 
  7. +----------+ 
  8. | 5001 | 
  9. +----------+ 
  10. 1 row in set (0.01 sec)

2:使用pt-table-checksum工具进行校验:

  1. # pt-table-checksum --user=root --password=123456 \ 
  2. --host=192.168.1.205 --port=3306 \ 
  3. --databases=test --tables=t2 --recursion-method=processlist \ 
  4. --no-check-binlog-format --nocheck-replication-filters \ 
  5. --replicate=test.checksums

3:登陆从库进行查询checksum表

  1. mysql> SELECT 
  2. FROM 
  3. test.checksums 
  4. WHERE 
  5. master_cnt <> this_cnt 
  6. OR master_crc <> this_crc 
  7. OR ISNULL(master_crc) <> ISNULL(this_crc)

4:使用pt-table-sync工具进行数据重新同步

  1. # pt-table-sync --execute --replicate \ 
  2. test.checksums --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456 

5:从库上验证数据,中文“员工”变成了“??”

检查主库,发现出现一样的情况,中文“员工”变成了“??”,猜想和字符集设置相关。

于是检查数据库字符集设置,发现test库字符集非utf8

主从库my.cnf文件添加如下配置项后重启数据库实例

  1. character_set_client=utf8 
  2. character_set_server=utf8

重新执行以上1-4步,发现一切正常!关键第4步要加--charset=utf8 参数

  1. # pt-table-sync --execute --replicate \ 
  2. test.checksums --charset=utf8 \ 
  3. --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456

时间: 2024-08-02 05:10:04

使用Percona Toolkit解决Mysql主从不同步问题【备忘】的相关文章

两种方法解决MySQL主从不同步

今天发现Mysql的主从数据库没有同步 先上Master库: mysql>show processlist; 查看下进程是否Sleep太多.发现很正常. show master status; 也正常. mysql> show master status; +-------------------+----------+--------------+-------------------------------+ | File | Position | Binlog_Do_DB | Binlo

主从同步-mysql主从数据同步报error 2003

问题描述 mysql主从数据同步报error 2003 两台服务器,内网地址可以ping通,从任何一个都可以登入另一个数据库, 但是同步的时候,一直报error 2003 的问题,而且这个同步账号是可以在从服务商登入到主服务的,求数据库大神解答,急求大神指点

Mysql 主从数据库同步

环境: 主服务器:centos 5.2 mysql 5.1.35 源码 IP:192.168.1.22 从服务器:centos 5.2 mysql 5.1.35 源码 IP:192.168.1.33 配置: 一.主服务器 1.1.创建一个复制用户,具有replication slave 权限. mysql>grant replication slave on *.* to 'repl'@'192.168.1.22′ identified by 'repl'; 1.2.编辑my.cnf文件 vi

MySQL主从数据库同步延迟问题解决

MySQL的主从同步是一个很成熟的架构,优点为:①在从服务器可以执行查询工作(即我们常说的读功能),降低主服务器压力;②在从主服务器进行备份,避免备份期间影响主服务器服务;③当主服务器出现问题时,可以切换到从服务器. 相信大家对于这些好处已经非常了解了,在项目的部署中也采用这种方案.但是MySQL的主从同步一直有从库延迟的问题,那么为什么会有这种问题.这种问题如何解决呢? 1. MySQL数据库主从同步延迟原理. 2. MySQL数据库主从同步延迟是怎么产生的. 3. MySQL数据库主从同步延

Mysql 主从数据库同步(centos篇)_Mysql

环境: 主服务器:centos 5.2 mysql 5.1.35 源码 IP:192.168.1.22 从服务器:centos 5.2 mysql 5.1.35 源码  IP:192.168.1.33 配置: 一.主服务器     1.1.创建一个复制用户,具有replication slave 权限. mysql>grant replication slave on *.* to 'repl'@'192.168.1.22' identified by 'repl';     1.2.编辑my.

减少mysql主从数据同步延迟问题的详解_Mysql

基于局域网的master/slave机制在通常情况下已经可以满足'实时'备份的要求了.如果延迟比较大,就先确认以下几个因素: 1. 网络延迟2. master负载3. slave负载一般的做法是,使用多台slave来分摊读请求,再从这些slave中取一台专用的服务器,只作为备份用,不进行其他任何操作,就能相对最大限度地达到'实时'的要求了 另外,再介绍2个可以减少延迟的参数   –slave-net-timeout=seconds  参数含义:当slave从主数据库读取log数据失败后,等待多久

MYSQL主从数据库同步备份配置的方法_Mysql

下文分步骤给大家介绍的非常详细,具体详情请看下文吧. 一.准备 用两台服务器做测试: Master Server: 192.0.0.1/Linux/MYSQL 4.1.12 Slave Server: 192.0.0.2/Linux/MYSQL 4.1.18       做主从服务器的原则是,MYSQL版本要相同,如果不能满足,最起码从服务器的MYSQL的版本必须高于主服务器的MYSQL版本 二.配置master服务器 1. 登录Master服务器,编辑my.cnf #vim /etc/my.c

mysql 主从数据同步备份经验分享

mysql教程 主从数据同步备份经验分享 准备工作: 1.二台机器(我的是winxp ip 192.168.0.119从主服务器 win2003 192.168.0.17主服务器) 2.在两台机器分别装上mysql数据库教程服务器(注:最好是从服务器版本要高于主服务器版本) 3.为了方便记忆我把主服务器192.168.0.17称作111cn.net-a,从服务器192.168.0.119 111cn.net-b机器 首页我们配置主服务器,创建一个数据库 a111cnnet 创建表test 找到你

mysql 数据库导入\导出(总结备忘)

 数据库的基本导入\导出的命令 是 mysqldump 和 source  在linux下直接用命令行操作就可以 在windows下 一般情况下有两种方法一个也是用命令行 另一个是用phpmyadmin   先来说说phpmyadmin 这个工具导出和导入很简单 而且导入时无需建库 直接还原成原来的数据库   用source  也可以还原 但他导入文件时有大小限制不能超过2M 再来说说  mysqldump 和 source  用命令操作很快 但是想把导出的文件再导入时必须先建立一个数据库(这个