利用pt-table-sync 解决主备数据不一致的问题

https://www.percona.com/doc/percona-toolkit/2.2/pt-table-sync.html

提醒

在使用之前备份将要操作的数据表
使用 --replicate or --sync-to-master方法，是在主库做修改，而不是直接修改备库

同步语法

-- Sync db.tbl on host1 to host2:
pt-table-sync --execute h=host1,D=db,t=tbl h=host2

-- Sync all tables on host1 to host2 and host3:
pt-table-sync --execute host1 host2 host3

-- Make slave1 have the same data as its replication master:
pt-table-sync --execute --sync-to-master slave1 

# Resolve differences that pt-table-checksum found on all slaves of master1:
pt-table-sync --execute --replicate test.checksum master1

# Same as above but only resolve differences on slave1:
pt-table-sync --execute --replicate test.checksum --sync-to-master slave1

# Sync master2 in a master-master replication configuration, where master2’s copy of db.tbl is known or suspected to be incorrect:
pt-table-sync --execute --sync-to-master h=master2,D=db,t=tbl

# Note that in the master-master configuration, the following will NOT do what you want, because it will make changes directly on master2, which will then flow through replication and change master1’s data:
#! Don't do this in a master-master setup!
pt-table-sync --execute h=master1,D=db,t=tbl master2

# 有主键或者唯一键，在主库进行 replace into 的操作
pt-table-sync --execute h=192.168.3.26,u=root,p=zhujie1986,D=working,t=department,P=3306 --sync-to-master --verbose --verbose --charset=utf8 --print

# 没主键或唯一键，直接在备库操作，要有超级用户权限
pt-table-sync --execute h=192.168.3.25,u=root,p=zhujie1986,D=working,t=department,P=3306 h=192.168.3.26 --no-check-slave --verbose --verbose --charset=utf8 --print

风险

FBI WARNING: pt-table-sync changes data! Before using this tool, please:

Read the tool’s documentation
Review the tool’s known “BUGS”
Test the tool on a non-production server
Backup your production server and verify the backups
pt-table-sync is mature, proven in the real world, and well tested, but if used improperly it can have adverse consequences. Always test syncing first with --dry-run and --print.

功能点

使用单向和双向同步数据
并不会同步表结构、索引或者其他对象

针对单向数据同步

--replicate的目的
找出不同

匹配主库

if DSN has a t part, sync only that table:
   if 1 DSN:
      if --sync-to-master:
         The DSN is a slave.  Connect to its master and sync.
   if more than 1 DSN:
      The first DSN is the source.  Sync each DSN in turn.
else if --replicate:
   if --sync-to-master:
      The DSN is a slave.  Connect to its master, find records
      of differences, and fix.
   else:
      The DSN is the master.  Find slaves and connect to each,
      find records of differences, and fix.
else:
   if only 1 DSN and --sync-to-master:
      The DSN is a slave.  Connect to its master, find tables and
      filter with --databases etc, and sync each table to the master.
   else:
      find tables, filtering with --databases etc, and sync each
      DSN to the first.

pt-table-sync默认不使用 --replicate参数，程序内部找出表数据的差异并修复差异
如果启用，pt-table-sync会读取 pt-table-checksum已经验证出的差异信息
必须指定需要同步的数据库信息：
- --sync-to-master，后面跟备库的信息；程序运行过程中自动发现并连接主库
- 检测到差异，在主库上做修改；通过复制，同步到备库
- 如果是一主多重的环境，那么所有备库都会同步更新
- 如果不指定 --sync-to-master，那么必须指定至少两个 DSN配置，最前一个作为主库，后一个作为备库
- 如果配置为主库的信息实际上是备库，那么进程将停止运行，因为备库不可写；
如果使用了 --replicate但是没有使用 --sync-to-master，那么只需要一个主库的DSN配置；程序会自动发现所有的备库，并且同时修复差异的数据表
以 DSN的形式配置的第一个数据库，其后的 DSN配置会使用第一个的参数资源，比如

pt-table-sync --execute h=host1,u=msandbox,p=msandbox h=host2

host2 将会使用 host1的 u,p参数连接数据库

限制

Replicas using row-based replication

pt-table-sync requires statement-based replication when used with the --sync-to-master or --replicate option. Therefore it will set binlog_format=STATEMENT on the master for its session if required. To do this user must have SUPER privilege.

输出 --verbose --print --charset=utf8

pt-table-checksum --nocheck-binlog-format --nocheck-replication-filters --replicate=percona.checksums --set-vars innodb_lock_wait_timeout=50 --host=192.168.3.25 --port=3306 --user=root --password=zhujie1986 --databases working --tables department --replicate-check
            TS ERRORS  DIFFS     ROWS  CHUNKS SKIPPED    TIME TABLE
01-18T14:58:11      0      1        7       1       0   0.009 working.department

pt-table-sync --execute h=192.168.3.25,u=root,p=zhujie1986,D=working,t=department,P=3306 h=192.168.3.26 --no-check-slave --verbose --charset=utf8
# Syncing A=utf8,D=working,P=3306,h=192.168.3.26,p=...,t=department,u=root
# DELETE REPLACE INSERT UPDATE ALGORITHM START    END      EXIT DATABASE.TABLE
#      0       0      7      0 GroupBy   14:59:28 14:59:28 2    working.department

同步处理流程

在主备表结构相同，且存在唯一索引或主键的情况下，优先使用 INSERT UPDATE DELETE 操作数据，解决数据差异问题
在主备表结构不同，但是主库表存在主键，备库表存在唯一索引的情况下，将会使用 DELETE REPLACE 修复数据

可选参数

- --verbose：输出差异数据处理信息，--verbose --verbose 输出块信息
- --print：输出处理 SQL语句
- --charset=utf8：设置编码，主要针对插入
- --no-check-slave：直接在备库插入，需要超级用户权限

算法

使用不同的算法来验证数据差异
根据索引、字段类型以及 --algorithms参数指定的值来选择最优的算法
Chunk
- 第一个字段是数字类型（date/time）的索引，并根据 --chunk-size的值设置 chunk大小和个数
- 每次验证一个块，整个块作为一个整体算出一个值
- 如果取得的块值不相同，那么单独验证这个块的数据
- 每个块相对来说都是很小的，小号的系统资源、带宽等可以忽略不计
- 验证块数据的时候，只有主键和算法值会通过网络传输，一边验证
- 验证结果有差异，才会传输整个块的行记录

时间： 2024-10-03 22:12:22

利用pt-table-sync 解决主备数据不一致的问题的相关文章

主备不一致：Table definition on master and slave does not match

昨天一同事在线上做变更,为了保证主库的稳定性,先在备库把binlog关闭,然后在进行DDL变更,在通过切换HA,把备库切换为主库,在老的主库上做DDL变更看上去这样做法没有太大的问题,但是当备库变更一做完,HA切换到备库,开始老主库变更的时候,备库就出现复制出现错误: Last_Error: Table definition on master and slave does not match: Column 10 type mismatch – received type 3, dbname

mysql 主备复制下的可靠性漫谈（三）

引言: 前面两期主要针对各种故障条件下,对数据可靠性带来的挑战及普通应对策略.本文主要针对在主备非强同步复制模式下,能否保证数据可靠性来讨论. 复制模式概述: 异步模式:主库收到commit 请求后,依次执行:写redo log prepare,写入binlog,写redo log commit,返回客户端成功. 半同步模式:主库收到commit 后,依次执行 redo log prepare,写binlog/发往备库(两个步骤并行),等待备库回复收到ack,redo

简单的主备切换方案

主备切换是很多高可用性系统都必须解决的问题,方法有很多,象基于ZooKeeper的主备切换就是一个很好的选择. 在这里提供一种更简单但不完美的主备切换方法: 1) 假设A和B是集群中的主控(Master)节点 2) 1~7是工作节点(如HDFS中的DataNode) 3) 在每个工作节点上,都同时配置了A和B的IP,而且是对等的,无主备之分所谓主:是指提供服务的主控,而备是指不提供服务的主控,当主故障时,由备接管其它服务,但因网络原因,可能主和备都未故障,这个是解决主备切换的关键问题所在. 选

MySQL · 捉虫动态 · ALTER IGNORE TABLE导致主备不一致

背景我们知道当一张表的某个字段存在重复值时,这个字段没办法直接加UNIQUE KEY,但是MySQL提供了一个 ALTER IGNORE TABLE的方式,可以忽略修改表结构过程中出现的错误,但是要忽略UNIQUE重复值,就需要打开old_alter_table,也就是拷贝表的方式来ALTER TABLE. 例如这样: CREATE TABLE t1(c1 int) ENGINE = InnoDB; INSERT INTO t1 VALUES (1), (1); SET old_alter_t

利用Repeater控件显示主－从关系数据表

NestedRepeater.aspx NestedRepeater.aspx.csusing System;using System.Data;using System.Data.SqlClient;using System.Web;using System.Web.SessionState;using System.Web.UI;using System.Web.UI.WebControls;namespace eMeng{/// /// NestedRepeater 的摘要说明./// 本

利用XMLHTTP无刷新自动实时更新数据.

xml|数据|刷新|无刷新前些时间写了几篇关于XMLHTTP运用的实例. (可以到http://dev.csdn.net/user/wanghr100看之前的几编关于XMLHTTP的介绍.) 近来看论坛上经常有人提问关于如何无刷新,自动更新数据. 传统上,我们浏览网页,如果加入最新的数据.只能是等我们重新向服务器端请求时才能显示出来. 但是,对于一些时效性很强的网站.传统的这种做法是不能满足的. 我们可以让程序自动刷新.定时向服务器请求数据.5秒取一次数据,10秒取一次数据. 利用XMLHTT

SQL Server利用HashKey计算列解决宽字段查询的性能问题

SQL Server利用HashKey计算列解决宽字段查询的性能问题主人翁本文主人翁:MSSQL菜鸟和MSSQL老鸟. 问题提出某年某月某日,某MSSQL菜鸟满脸愁容的跑到老鸟跟前,心灰意懒的对老鸟说"我最近遇到一个问题,很大的问题,对,非常大的问题".老鸟不急不慢的推了推2000度超级近视眼镜框,慢吞吞的说:"说来听听". "我有一个100万数据量的表,有一个宽度为7500字段,不幸的是现在我需要根据这个字

MySQL主备复制原理、实现及异常处理

复制概述 MySQL支持三种复制方式:基于行(Row)的复制.基于语句(Statement)的复制和混合类型(Mixed)的复制. 基于语句的复制早在3.23版本中就存在,而基于行的复制方式在5.1版本中才被加进来.这两种方式都是通过在主库上记录二进制日志.在备库重放日志的方式来实现异步的数据复制. 混合类型的复制:默认采用基于语句的复制,一旦发现基于语句的无法精确的复制时,就会采用基于行的复制. 复制通常不会增加主库的开销,主要是启用二进制日志带来的开销,但出于备份或及时从崩溃中恢复的目的,这

云服务器 ECS 配置：利用MySQL读写分离，提升应用数据吞吐性能

利用MySQL读写分离,提升应用数据吞吐性能背景一般情况下,对数据库的读和写都在同一个数据库服务器中操作时,业务系统性能会降低.为了提升业务系统性能,优化用户体验,可以通过读写分离来减轻主数据库的负载.本篇文章分别从应用层和系统层来介绍读写分离的实现方法. 应用层实现方法: 应用层中直接使用代码实现,在进入Service之前,使用AOP来做出判断,是使用写库还是读库,判断依据可以根据方法名判断,比如说以query.find.get等开头的就走读库,其他的走写库. 优点: 1.多数据源切换方便

猜你喜欢

求大神-通知栏背景设置，越简单越好

问题描述通知栏背景设置,越简单越好如何修改APP最上面那一栏的背景色,即显示电池电量和时间那一栏,不要用反编译什么的,太复杂了,看不懂,本人初学,谢谢解决方案设置activity主题为full ...

如何快速制造一个成功的中文web2.0网站？

web|web2|中文 web2.0的风光在如今的互联网上简直无人与其争锋,随着英文web2.0网站的快速发展,中文web2.0网站也随之增多.这类网站最大的潜在利益就是容易被风险投资商看中,进行投资 ...

让我们一起深入学习CSS样式表的滤镜

css|滤镜|样式表样式表是一种为超文本标签语言提供增强补充服务的技术,可对每一个html的标签做精雕细刻的修饰.只用html制作的网页,对页面内各部分的修饰能力有限且语句烦锁,样式表正是弥补这一缺 ...

J2EE deployment files (application.xml)

application|j2ee|xml <application> The application element is the root element of a J2EE appli ...

NetBSD安装日记

我以前是玩儿linux的,但现在爱上了bsd,因为bsd更简洁明快,比较干净,现在的linux发行版显得非常的杂乱,相比起来我更喜欢bsd的整洁!说真的,我觉得现在中国玩儿linux的人大都是为了赶时 ...

C++ POCO库中文编程参考指南（6） Poco::Timestamp

1 类型别名三个时间戳相关的类型别名,TimeDiff表示两个时间戳的差,第二个是以微秒为单位的时间戳,第三个是以 100 纳秒(0.1 微妙)为单位的时间戳: typedef Int64 Ti ...

BGP路由反射器概述

为了在AS内部防止环路,"IBGP对等体不允许对外宣告学习自其它IBGP对等体的路由",所以要求IBGP邻居全互联.这就意味着在AS内需要建立n(n-1)条IBGP连接.路由反射器 ...

UVa 12640 Largest Sum Game (water ver.)

12640 - Largest Sum Game Time limit: 1.000 seconds http://uva.onlinejudge.org/index.php?option=com_o ...

详解Oracle的SQL语句处理过程

在调整之前我们需要了解一些背景知识,只有知道这些背景知识,我们才能更好的去调整sql语句. 本节介绍了SQL语句处理的基本过程,主要包括: . 查询语句处理 . DML语句处理(insert, upd ...

Access5.7什么是主键？

在数据库中常常不只是一个表这些表之间也不是相互独立的不同的表之间需要建立一种关系才能将它们的数据相互沟通而在这个沟通过程中就需要表中有一个字段作为标志不同的记录对应的字段取值不能相同也不能是空白的 ...

怎么打开酷狗里的MV文件

首先先打开360安全卫士的"电脑清理". 再打开查找大文件. 打开之后查找.查找后,按右边的扇形统计图蓝色的部分,如图. 摄影教程点击后就能看到酷狗MV文件了! 再点击这个文件, ...

php遍历目录方法小结

这篇文章主要介绍了php遍历目录方法,实例总结了常用的两种实现技巧,具有一定参考借鉴价值,需要的朋友可以参考下本文实例总结了php遍历目录方法.分享给大家供大家参考.具体如下: 1. 方法 ...

PowerPoint 2007教程之制作旋转风车

一.单个扇形的制作风车可以看成不同颜色的扇形面组成的.我们可以利用自选图形来制作它.比如简单一点的,用六个圆心角为60度半径相同的扇形,每个扇形填充不同的颜色,这样就可以得到一个简单的风车图形了 ...

vxWorks下dosFs文件系统的创建

文件系统,是指操作系统根据目录和文件的组织形式在磁盘设备上应用的一种设备驱动,不同的文件系统对目录和文件有不同的限制(如目录名限制,文件大小限制等). VxWorks支持多种文件系统,比较重要的有 ...

unicode编码-在三星S4行开发Android应用遇到一个Unicode编码的问题，请高手赐教，非常感谢

问题描述在三星S4行开发Android应用遇到一个Unicode编码的问题,请高手赐教,非常感谢从服务器端获取unicode字节数组,打印出来为003300300030003300300031,从 ...

安装安卓环境ADT23.0.4出错，求大神帮助

问题描述安装安卓环境ADT23.0.4出错,求大神帮助在myeclipse安装ADT 23.0.4之后,所有项目都打不开,打开后出现这个错误 An error has occurred. See ...

stl-迭代器模式和STL迭代器

问题描述迭代器模式和STL迭代器请问STL迭代器和设计模式中的迭代器之间的异同点,stl迭代器是否使用了迭代器模式? 解决方案 stl迭代器就是设计模式中外部迭代器的一个经典案例.

求教过来人推荐一些学习书籍

问题描述我是自学编程,没上过大学.学过其他编程语言,做过一些小软件.我想学习.NET(C#)主要开发一些网站,以及可以用C#写一些桌面应用小工具.但是,我不知道该怎么样循序渐进的学习.我查了一下,推 ...

ORA-01017/ORA-02063DbLink建立错误问题分析及解决

ORA-01017/ORA-02063DbLink建立错误问题分析及解决故障介绍: 我在oracle10.2.0.4中建立连接到11.2.0.3的DBLINK验证的时候出现如下错误: ORA-0 ...

常用的linux命令详解

Linux命令行吸引了大多数Linux爱好者.一个正常的Linux用户一般掌握大约50-60个命令来处理每日的任务.Linux命令和它们的转换对于Linux用户.Shell脚本程序员和管理员来说是最有 ...

在Linux系统上查看Apache服务器的错误日志_Linux

错误日志和访问日志文件为系统管理员提供了有用的信息,比如,为 Web 服务器排障,保护系统不受各种各样的恶意活动侵犯,或者只是进行各种各样的分析以监控 HTTP 服务器.根据你 Web 服务器配置的不 ...

hibernate spring-hbm2ddl.auto 自动创建表

问题描述 hbm2ddl.auto 自动创建表 hbm2ddl.auto=update 时,实体类采用注解方式, @Id @GeneratedValue(generator="payment ...

机器学习算法一览

引言提起笔来写这篇博客,突然有点愧疚和尴尬.愧疚的是,工作杂事多,加之懒癌严重,导致这个系列一直没有更新,向关注该系列的同学们道个歉.尴尬的是,按理说,机器学习介绍与算法一览应该放在最前面写,详细的 ...

力助防灾减灾应急通信上海将建十座超级基站

本报讯在5月12日大地震一周年和我国首个防灾减灾日之际,记者获悉,上海移动目前正在建设4个抗灾"超级基站",规划在未来将在全市建设10到15个超级基站,将能在紧急灾害事件发生时满 ...

招聘行业的“类发展要素”应该怎样整合

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅最近在平台上发表了几篇文章,说了说 ...

javaScript同意等待代码实现心得_javascript技巧

正确源程序如下: 复制代码代码如下: <script type="text/javascript"> var lastTime = 3; function abc() ...

OpenStack Days China会议将于7月14-15日在北京国家会议中心盛大召开

问题描述还有不到一个月时间,国内OpenStack领域的盛会将在北京国家会议中心隆重举办,本次活动得到了OpenStack基金会官方授权和大力支持,旨在打造国内OpenStack领域和全球都极具影响 ...

sharppcap4.2版本抓数据包错误：Protocol of 49185 is not implemented

问题描述 c#调用sharppcap4.2抓网卡数据包,正常抓取但是就会不停的报异常错误Protocolof49185isnotimplementedprivatevoiddevice_OnPacke ...

云话首次跨界合作移动APP再推新潮

本文讲的是云话首次跨界合作移动APP再推新潮,随网络世界的飞速发展,伴随网络而生的移动APP软件也在不断的成熟,但很多移动APP软件还都在自己的行业中寻求发展和进步,本次超越常理的"云话& ...

希捷发布新NAS产品为小型企业提供存储便利性

希捷科技日前宣布推出专门为目前小型企业而设计的一套新的网络附加存储(NAS)解决方案产品组合.新的产品组合包括5款容量为2TB至30TB的NAS产品,性能完全可以满足多达50名员工的家庭办公室和小型 ...

热搜