为MySQL选择合适的备份方式

数据库的备份是极其重要的事情。如果没有备份,遇到下列情况就会抓狂:

  UPDATE or DELETE whitout where…

  table was DROPPed accidentally…

  INNODB was corrupt…

  entire datacenter loses power…

  从数据安全的角度来说,服务器磁盘都会做raid,MySQL本身也有主从、drbd等容灾机制,但它们都无法完全取代备份。容灾和高可用能帮我们有效的应对物理的、硬件的、机械的故障,而对我们犯下的逻辑错误却无能为力。每一种逻辑错误发生的概率都极低,但是当多种可能性叠加的时候,小概率事件就放大成很大的安全隐患,这时候备份的必要性就凸显了。那么在众多的MySQL备份方式中,哪一种才是适合我们的呢?

  常见的备份方式

  MySQL本身为我们提供了mysqldump、mysqlbinlog远程备份工具,percona也为我们提供了强大的Xtrabackup,加上开源的mydumper,还有基于主从同步的延迟备份、从库冷备等方式,以及基于文件系统快照的备份,其实选择已经多到眼花缭乱。而备份本身是为了恢复,所以能够让我们在出现故障后迅速、准确恢复的备份方式,就是最适合我们的,当然,同时能够省钱、省事,那就非常完美。下面就我理解的几种备份工具进行一些比较,探讨下它们各自的适用场景。

  1. mysqldump & mydumper

  mysqldump是最简单的逻辑备份方式。在备份myisam表的时候,如果要得到一致的数据,就需要锁表,简单而粗暴。而在备份innodb表的时候,加上–master-data=1 –single-transaction 选项,在事务开始时刻,记录下binlog pos点,然后利用mvcc来获取一致的数据,由于是一个长事务,在写入和更新量很大的数据库上,将产生非常多的undo,显著影响性能,所以要慎用。

  优点:简单,可针对单表备份,在全量导出表结构的时候尤其有用。

  缺点:简单粗暴,单线程,备份慢而且恢复慢,跨IDC有可能遇到时区问题。

  mydumper是mysqldump的加强版。相比mysqldump:

  内置支持压缩,可以节省2-4倍的存储空间。

  支持并行备份和恢复,因此速度比mysqldump快很多,但是由于是逻辑备份,仍不是很快。

  2. 基于文件系统的快照

  基于文件系统的快照,是物理备份的一种。在备份前需要进行一些复杂的设置,在备份开始时刻获得快照并记录下binlog pos点,然后采用类似copy-on-write的方式,把快照进行转储。转储快照本身会消耗一定的IO资源,而且在写入压力较大的实例上,保存被更改数据块的前印象也会消耗IO,最终表现为整体性能的下降。而且服务器还要为copy-on-write快照预留较多的磁盘空间,这本身对资源也是一种浪费。因此这种备份方式我们使用的不多。


3. Xtrabackup

  这或许是最为广泛的备份方式。percona之所以家喻户晓,Xtrabackup应该功不可没。它实际上是物理备份+逻辑备份的组合。在备份innodb表的时候,它拷贝ibd文件,并一刻不停的监视redo log的变化,append到自己的事务日志文件。在拷贝ibd文件过程中,ibd文件本身可能被写”花”,这都不是问题,因为在拷贝完成后的第一个prepare阶段,Xtrabackup采用类似于innodb崩溃恢复的方法,把数据文件恢复到与日志文件一致的状态,并把未提交的事务回滚。如果同时需要备份myisam表以及innodb表结构等文件,那么就需要用flush tables with lock来获得全局锁,开始拷贝这些不再变化的文件,同时获得binlog位置,拷贝结束后释放锁,也停止对redo log的监视。

  它的工作原理如下:

  由于mysql中不可避免的含有myisam表,同时innobackup并不备份表结构等文件,因此想要完整的备份mysql实例,就少不了要执行flush tables with read lock,而这个语句会被任何查询(包括select)阻塞,在阻塞过程中,它又反过来阻塞任何查询(包括select)。如果碰巧备份实例上有长查询先于flush tables with read lock执行,数据库就会hang住。而当flush tables with read lock获得全局锁后,虽然查询可以执行,但是仍会阻塞更新,所以,我们希望flush tables with read lock从发起到结束,持续的时间越短越好。

  为了解决这个问题,有两种比较有效的方法:

  1. 尽量不用myisam表。

  2. Xtrabackup增加了–rsync选项,通过两次rsync来减少持有全局锁的时间。

  优化后的备份过程如下:

  优点:在线热备,全备+增备+流备,支持限速,支持压缩,支持加密。

  缺点:需要获取全局锁,如果遇到长查询,等待时间将不可控,因此要做好监控,必要时杀死长查询或自杀;遇到超大的实例,备份过程较长,redo log太大会影响恢复速度,这种情况下最好采用延迟备份。

  4. mysqlbinlog 5.6

  上述所有的备份方式,都只能把数据库恢复到备份的某个时间点:mysqldump和mydumper,以及snapshot是备份开始的时间点;Xtrabackup是备份结束的时间点。要想实现point in time的恢复,还必须备份binlog。同时binlog也是实现增备的宝贵资源。

  幸运的是,mysql 5.6为我们提供了远程备份binlog的选项:

  <code>mysqlbinlog --raw --read-from-remote-server --stop-never</code>

  它会伪装成mysql从库,从远程获取binlog然后进行转储。这对线上主库容量不够无法保存较多binlog的场景非常有用。但是,它毕竟不像真正的mysql从库实例,状态监控和同步都需要单独部署。因此个人觉得采用blackhole来备份全量的binlog是更好的选择。笔者曾经实现过一个自动搭建blackhole从库的工具,稍加修改,就可以完美搭建出blackhole从库。一旦同步起来,基本一劳永逸,很少出问题,主从切换的时候跟着切了就行。

  提示:

  不要小看binlog的备份。当5.6的多线程复制大规模使用后,从库追赶主库命令点的耗时将被极大缩短,这样我们把每天一次的全量备份改为每3天一次、甚至每周一次的全量备份,和持续的binlog增量备份。遇到故障需要恢复数据的时候,重放3、5天的binlog也是极快的。降低备份频率最直接的好处是,省钱、省事。

  blackhole对于备份binlog是极好的。一方面可以长久的备份binlog用于恢复数据库,另一方面,在其上配置半同步复制,可以有效防止主库的binlog丢失。

  总结

  备份方式各有千秋,而对我们来说,面对数千实例,选择合适的备份工具来实现统一配置、统一规划,构建智能调度的备份云平台才是王道。毕竟,多种备份方式共存的运维成本是不容忽视的。

  从使用经验来看,用Xtrabackup全备数据,用blackhole增备binlog,并定期对备份数据的有效性进行验证,是当下比较好的选择。

最新内容请见作者的GitHub页:http://qaseven.github.io/

时间: 2025-01-21 15:10:08

为MySQL选择合适的备份方式的相关文章

如何选择合适的导航方式

  此文章列出了目前移动端常用的一些导航方式,并列出了优缺点.希望大家在做产品的时候能有所参考,有所考量.在不同的环境,不同的情况下选择合适的导航方式.让产品更加易用,好用.

如何选择合适的备份技术

NetApp备份和恢复解决方案总监 David具有20多年的行业经验,特别是数据可用性.数据灾难 恢复和业务恢复实践.他是"实施备份和恢复:企业准备指南"的合著者并被公认为备份和恢复.灾难恢复和业务恢复实践领域的权威. 在人们想到NetApp时,他们通常会联想到 "主存储".这虽然没错,但 NetApp 其实还在世界各地设计和实施备份与恢复解决方案方面具有极为丰富的经验,无论是大型数据中心,还是IT员工不多的小型远程办公室都能做到尽善尽美 .财富100强中超过60%

如何为DB2桌面应用选择合适的集成方式

本文主要介绍了不同 Window 桌面客户端访问 DB2 Express-C 数据库的方式,主要包括:Java 平台的 JDBC 方式:http://www.aliyun.com/zixun/aggregation/13480.html">.NET 平台的 ADO.NET 方式:以及 Window 操作系统当中的 ODBC 和 OLE DB 的方式.本文的目标读者对象:DB2 开发人员 , Window 桌面应用开发人员 , .Net 开发人员. IBM DB2 Express-C Edi

详解Ntbackup的五种备份方式(上)

不得不承认,ntbackup真的很陈旧,但确实是与windows系统兼容性最好的一款备份工具,我们不仅仅可以用它来备份系统,还可以备份各类文件以及定制灵活的备份计划任务,可以从某种程度上减轻我们的工作. 本文就是想和大家讨论一下ntbackup工具,及其5种备份方式. 通过本文,你可以了解到 ◆Ntbackup作用 ◆什么是存档标记,及其具体作用 ◆如何通过实例来理解5种备份方式 ◆如何根据不同需求选择合适的备份方式 一.认识 Ntbackup Ntbackup工具windows系统安装时内置的

如何选择适合的提示方式(RPG游戏篇)

玩游戏时,常碰到一些游戏的反馈频频打断的正常游戏,破坏游戏的沉浸感和流畅度.合理的反馈设计,可以避免以上问题,但反馈的形式丰富多样,如何选择合适的提示方式是诸多设计师思考的话题.这里谈点一家之言,希望能和大家一起探讨. 一.不要随意打断用户 玩家在游戏中感受某种文化意境.虚拟的生活,越少的粗暴打断其行为,越有利于玩家沉浸在角色扮演中.玩家扮演某个角色,是要沉浸玩法的虚拟世界里,而不是玩界面,更不想只是和各种界面交互.频繁不合理的反馈弹窗,或看不到应有的反馈,势必会影响玩家的沉浸感(也可以说是"流

《深入理解Elasticsearch(原书第2版)》一2.5 选择正确的查询方式

2.5 选择正确的查询方式 在<Elasticsearch Server,Second Edition>一书中,我们详细介绍了Elasticsearch的查询DSL,这一种使用JSON结构化的查询语言,可以构建极其复杂的查询语句.不过,在那本书中我们没有探讨在不同的场合可以用到哪些查询方式,以及应该使用哪种查询方式.对于一个在全文搜索引擎领域没有经验储备的人来说,Elasticsearch提供的查询方式显得太多了,而且容易让人迷惑.因此我们将在本书中对这方面的知识做一些深入探讨,从而引导读者如

《深入理解Elasticsearch(原书第2版)》——2.5 选择正确的查询方式

2.5 选择正确的查询方式 在<Elasticsearch Server,Second Edition>一书中,我们详细介绍了Elasticsearch的查询DSL,这一种使用JSON结构化的查询语言,可以构建极其复杂的查询语句.不过,在那本书中我们没有探讨在不同的场合可以用到哪些查询方式,以及应该使用哪种查询方式.对于一个在全文搜索引擎领域没有经验储备的人来说,Elasticsearch提供的查询方式显得太多了,而且容易让人迷惑.因此我们将在本书中对这方面的知识做一些深入探讨,从而引导读者如

MySQL数据库的数据备份和恢复详解

本文讨论 MySQL 的备份和恢复机制,以及如何维护数据表,包括最主要的两种表类型:MyISAM 和 Innodb,文中设计的 MySQL 版本为 5.0.22. 目前 MySQL 支持的免费备份工具有:mysqldump.mysqlhotcopy,还可以用 SQL 语法进行备份:BACKUP TABLE 或者 SELECT INTO OUTFILE,又或者备份二进制日志(binlog),还可以是直接拷贝数据文件和相关的配置文件.MyISAM 表是保存成文件的形式,因此相对比较容易备份,上面提到

《SQL Server企业级平台管理实践》读书笔记——关于SQL Server数据库的备份方式

原文:<SQL Server企业级平台管理实践>读书笔记--关于SQL Server数据库的备份方式 数据备份一直被认为数据库的生命,也就是一个DBA所要掌握的主要技能之一,本篇就是介绍SQL Server备份原则,SQL Server数据库分为数据文件和日志文件.为了使得数据库能够恢复一致点,备份不仅需要拷贝数据数据文件里的内容,还要拷贝日志文件里的内容.那么根据每次备份的目标不同,我们可以将备份分为数据备份和日志备份. 数据备份的范围可以是完整的数据库.部分数据库.一组文件或文件组.所以根