Mongorestore的archive(归档)模式恢复原理解析

在上篇Mongodump的archive（归档）模式原理解析中介绍过，Mongodump的archive（归档）模式产生的文件是将多个集合的数据通过一个Multiplexer多路复用混合在一起，因此对应在恢复的时候就需要有一个Demultiplexer来将数据进行解析，是一个多路复用的逆过程。对应于mongodump，MongoDB官方提供了mongorestore这个恢复工具。

归档文件的格式

复习一下归档文件的格式，其最前面有4个字节的magic number，然后是元数据部分（prelude），描述这个归档文件包含哪些集合、索引等信息，最后是body部分，由一个个slice组成，每个slice有一个header、若干个body和一个terminator，其中header和body都是一个bson，terminator是一个4字节的标记。如下图所示：

流程

从一个mongodump备份的归档文件中恢复的过程包括读取归档文件，解析成对应集合的数据，然后再恢复到目标MongoDB。为了同时支持非归档模式和归档模式，这里mongorestore做了一些抽象：主要包括Intent、file接口和DemuxOut。

Intent、file接口

Intent是对备份文件的抽象，一个Intent有可能是某一个集合的数据的备份文件（在非归档模式下是一个BSON文件），也有可能是某一个集合的元数据文件（在非归档模式下是一个JSON文件，其中包含集合创建时指定的option以及索引信息等，以.metadata.json结尾）。访问一个Intent需要通过file接口的Open()、Read()、Write()和Close()方法：

type file interface {
  io.ReadWriteCloser
  Open() error
}

在非归档模式下，对应的file接口的实现是realBSONFile和realMetadataFile。这两个实现的Open()方法调用os.Open()打开对应的文件，使用返回的File进行读取数据。

在归档模式下，mongorestore定义了几个特定的file接口实现，来实现边读取并解析归档文件边恢复。

DemuxOut

之前介绍过，对于归档文件，由于是各个集合的数据按条（slice）混合在一起的，这样我们在顺序读取归档文件时就需要有一个Demultiplexer来将数据进行解混合（甚至进行分发以便可以实现多个集合并发恢复）。DemuxOut也是一组接口定义，主要负责定义Demultiplexer解析归档文件后如何输出数据：

type DemuxOut interface {
  Write([]byte) (int, error)
  Close() error
}

常规集合的Demux恢复流程

主协程通过读取归档文件的prelude，得到需要恢复的集合信息，然后为每个集合创建Intent。之后启动一个Demultiplexer协程（以下简称Demux协程）负责读取归档文件的body部分并进行解析，同时会启动N个Restore协程（根据指定的集合恢复并发度）进行恢复。Demux协程解析出某个集合的数据后调用DemuxOut的Write()方法将数据输出去。Restore协程从Intent的file接口读取数据，并执行恢复到目标MongoDB。

对于需要恢复的常规集合（包括oplog集合），mongorestore定义了一个RegularCollectionReceiver实现了file接口，定义了一个regularCollectionSender实现了DemuxOut接口。regularCollectionSender的Write()方法将这次要发送的数据长度通过一个readLenChan发送出去。RegularCollectionReceiver的Read()方法则等待在这个readLenChan上，等待新数据的通知，当收到数据长度通知时发送一个buf给它。Demux协程会将数据拷贝到这个buf中，再次通过readLenChan通知已拷贝的数据长度，然后继续往下解析。Restore协程收到数据拷贝完毕的通知后，将这些数据恢复到目标MongoDB。恢复的速度通常来说跟不上Demux解析的速度，因此RegularCollectionReceiver在必要时会将Demux发送过来的数据缓存起来慢慢消费。这样Demux协程就可以不停的往下解析，并且可以实现多集合并发恢复。

特殊集合的处理

有一些集合在恢复过程中是需要特殊处理的，这里所说的特殊处理，主要是需要在恢复的特定阶段进行处理。比如对于admin.system.version集合，需要在恢复常规集合之前进行auth版本是否兼容的判断。再比如用户和角色集合，是在恢复的最后阶段进行处理的。对于这些特殊集合，mongorestore的处理方法是，如果在归档文件读取并解析的过程中读取到了，会先缓存在一个buffer中，等到需要的时候再进行处理。在实现上，mongorestore针对这些集合定义了特殊的DemuxOut接口的实现：SpecialCollectionCache。这个实现包含一个bytes.Buffer，利用其Write()方法和Read()方法（这也是其对应的file接口的实现）实现集合数据的暂存和读取。为此，mongorestore为每个Intent都维护了一个对应的DemuxOut，以便可以特殊处理。

如何实现恢复的过程中过滤某些集合

有些集合是不需要进行恢复的，包括system.profile、索引以及不满足用户指定的filter条件的集合等。索引之所以不需要恢复是因为索引是统一通过集合的元数据文件中的描述在集合数据恢复完毕后进行重建的。对于这些不需要恢复的集合，对应的DemuxOut接口的实现是MutedCollection。这个实现的Write()、Close()方法都不干任何事情。这样就实现了过滤恢复。

多集合并发时的恢复优先级

如果在恢复的时候指定了多集合并发进行恢复，mongorestore会在恢复前初始化一个集合恢复优先级调度器。在非归档模式下，会使用一个MultiDatabaseLTF的优先级调度器。这个优先级调度器会在优先恢复大集合的同时兼顾不同数据库集合的并发恢复。在归档模式下，基本就是按照集合的数据在归档文件中的顺序进行恢复。在Demux协程发现一个新的需要恢复的常规集合后，会通过namespaceChan通知主协程，并由主协程转发给归档模式下的优先级调度器，在这里调用RegularCollectionReceiver的Open()方法进行相关初始化，以及注册对应的DemuxOut，建立Demux协程和Restore协程的数据流通通道。

时间： 2024-09-20 05:11:30

Mongorestore的archive(归档)模式恢复原理解析的相关文章

Oracle的Archive Log模式下的恢复工作

oracle|恢复学习并测试了一下Oracle数据库在开启Archive Log模式下的恢复. 系统是Win2K Server+Oracle 8.1.7. 参考了Chinaunix.net和ITPub.com网站相关资料.在此感谢给我的帮助. 注意,养成一个好的习惯非常重要.在开始恢复之前,以及恢复完成后,都要做一个系统全备份. 首先,要开启Archive Log归档日志模式 1. 关闭数据库 2. 修改initSID.ora文件.这个文件通常在$ORACLE_HOME/admin/$

oralce非归档模式下的恢复（一）历史日志没有被覆盖（可完全恢复）

案例1: 历史日志没有被覆盖(可以完全恢复) 1)切换到非归档模式 SQL> archive log list Database log mode Archive Mode Automatic archival Enabled Archive destination /disk1/arch/anny Oldest online log sequence 7 Next log sequence to archive

Android代码入侵原理解析(一)

Android代码入侵原理解析(一) 1.代码入侵原理代码入侵,或者叫代码注入,指的是让目标应用/进程执行指定的代码.代码入侵,可以在应用进行运行过程中进行动态分析,也是对应用进行攻击的一种常见方式.我把代码入侵分为两种类型:静态和动态.静态代码入侵是直接修改相关代码,在应用启动和运行之前,指定代码就已经和应用代码关联起来.动态代码入侵是应用启动之后,控制应用运行进程,动态加载和运行指定代码. 2.静态代码入侵静态代码入侵,有直接和间接的手段. 直接手段是修改应用本身代码

秋色园QBlog技术原理解析：独创的多语言翻译机制(九)

文章回顾: 1: 秋色园QBlog技术原理解析:开篇:整体认识(一) --介绍整体文件夹和文件的作用 2: 秋色园QBlog技术原理解析:认识整站处理流程(二) --介绍秋色园业务处理流程 3: 秋色园QBlog技术原理解析:UrlRewrite之无后缀URL原理(三) --介绍如何实现无后缀URL 4: 秋色园QBlog技术原理解析:UrlRewrite之URL重定向体系(四) --介绍URL如何定位到处理程序 5: 秋色园QBlog技术原理解析:Module之页面基类设计(五) --介绍创建

秋色园QBlog技术原理解析：Web之页面处理-内容填充(八)

RAC 环境下修改归档模式

RAC环境下的归档模式切换与单实例稍有不同,主要是共享存储所产生的差异.在这种情况下,我们可以将RAC数据库切换到非集群状态下,仅仅在一个实例上来实施归档模式切换即可完成RAC数据库的归档模式转换问题.本文主要描述了由非归档模式切换到归档模式,而由非归档切换的归档步骤相同,不再赘述. 1.主要步骤: 备份spfile,以防止参数修改失败导致数据库无法启动修改集群参数cluster_database为false 启动单实例到mount状态将数据库置于归档模式(alter databas

Oracle归档模式和非归档模式

Oracle归档模式和非归档模式解释归档和非归档模式之间的不同和它们各自的优缺点? 答:归档模式是指可以备份所有的数据库transactions并恢复到任意一个时间点. 非归档模式则相反,不能恢复到任意一个时间点. 但是非归档模式可以带来数据库性能上的少许提高. 记忆方式:归档模式>热备份>恢复任意时间点>性能少许下降非归档模式>冷备份>恢复完全备份>性能少许提高一.查看oracle数据库

归档模式下四种完全恢复的场景

在数据的备份恢复中,基本都在使用rman来做了,但是从数据库的内部原理来说,对于介质恢复,其实还是做两件事,restore和recover. restore是一个类似物理文件的复制,而recover则在数据库后台根据scn做相关的数据恢复. 在归档模式下,一般有下面四种场景可以做完全恢复,当然前提还是在有备份的情况下. 我们可以不依赖rman来手工完成备份恢复的这些过程.因为手工的过程其实也不复杂. 手工备份恢复,那么备份就是热备了.如果连归档没开,就会报出下面的错误. SQL> alter t

归档和非归档模式下ORA-01145错误的解决方法

总结了一下,在归档和非归档的场景下,ora-01145这个错误可能有如下三种情况: 1.off line tablespace --在非归档模式下尝试ofline 数据文件 SQL> alter tablespace tools offline immediate; alter tablespace tools offline immediate * ERROR at line 1:ORA-01145: offline immediate disallowed unless media reco

猜你喜欢

诺基亚比RIM更可能幸存下来的10个理由

Android手机以及利润随着市场份额的下降而蒸发.同时,由于投资者认为这两家公司最好的日子已经过去,这两家公司的股票价格一直在下降. 当然,情况并非一直如此.历史上曾有过一段时间,RIM和诺基亚在移 ...

Javascript实例教程:详解构造函数

文章简介:JavaScript作用域安全构造函数. 构造函数其实就是一个使用new操作符调用的函数.当使用new调用时,构造函数内用到的this对象会对指向新创建的对象实例,如下的例子所示: func ...

曾经激情的建站路超越真的是个梦？

2004年10月开始做网站,之前在单位负责公司外网和内网的管理(我不会技术,只做管理),我当初做网站的目的是想用实战检验下自己的理论水平. 当初做站纯粹是激情,很累,天天维持内容,想着推广.到05年5 ...

VB程序如何连接数据库

ODBC数据源 1. 什么是ODBC ODBC(Open Database Connectivity,开放式数据库互联),是目前国际上通用的数据库访问标准. 2. 什么是ODBC ...

WPAD的原理及实现过程

WPAD 通过让浏览器自动发现代理服务器,使代理服务器对用户来说是透明的,进而轻松访问互联网.WPAD 可以借助 DNS 服务器或 DHCP 服务器来查询代理自动配置(PAC)文件的位置. 引言代理 ...

在CB中如何自定义属性(properties)

Borland C++ Builder 对 C++ 进行了扩充,也可以象 Delphi 中一样自定义类属性. 对于简单类型的属性,可以如下定义: class TSome{protected:int a ...

2011年8月编程语言排行榜

8月4日,Tiobe公布了最新的8月编程语言排行榜,和7月榜单相比,最大变动就数微软的F#了,F#首次进入TOP20.1至10名中,PHP重返第4,C#则到了第5,其他不变. 以下内容根据Tiobe原 ...

那些年我们错过的魔术方法

PHP 对象的一个优势是可以使用魔术方法,这些方法可以不需要修改外部代码而重写一个类的默认行为,这使得PHP 语法有更少的冗余性和更具有扩展性.这些方法很好识别,他们都是以双下划线(__)开始的 P ...

图图桌面美化软件的添加分组功能介绍

图图桌面美化软件的添加分组功能,可以很方便的对快捷图标进行分类分组管理. 1.右击点击图图桌面面板的边框,就会弹出功能菜单,点击"添加分组".(如图) 2.点击"添加分组 ...

进WinPE蓝屏的三个原因　

1. 错误分析:Windows在启动过程中无法访问系统分区或启动卷. 一般发生在更换主板后第一次启动时, 主要是因为新主板和旧主板的IDE控制器使用了不同芯片组造成的. 有时也可能是病毒或硬盘损伤所引 ...

ios-像照相机的闪光灯效果怎么触发？

问题描述像照相机的闪光灯效果怎么触发? 我用下面的代码实现触发闪光灯方法: 1)调用: [device setTorchMode:AVCaptureTorchModeOn]; [device set ...

表数据日期转换问题

问题描述 try{if(listDateIndexs.Contains(j)){dr[j]=DateTime.Parse(DateTime.FromOADate(Convert.ToDouble(dr ...

eclipse创建maven工程时报错

问题描述 eclipse创建maven工程时报错使用的是官方的Eclipse中自带的m2e插件,创建maven项目时就弹出个错误在pom.xml文件那会显示个红X,提示如下: Multiple a ...

冷门博客的广告效应

冷门博客的广告效应 &http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 一个博客的广告效应,并不是根据这个博客 ...

虚拟化——未来云平台的必然趋势

我们能够期待下一代的云计算平台中有怎么样的新内容?又有哪些功能或性能是下一代平台可以提供的,或者某些更早期的竞争者已经提供了? 我们现在拥有的云计算平台最棒的地方在于排除了那些想要拥有和运行自己硬件的 ...

阿里巴巴整体上市又有新消息

昨天,<华尔街日报>援引消息人士的说法称,阿里巴巴集团正与香港股票交易所就公司的所有权结构进行谈判,一方面帮助阿里巴巴集团上市,另一方面也将使公司创始人马云及其管理团队保持对公司的控制 ...

《构建高可用VMware vSphere 5.X虚拟化架构》——2.6 vCenter Server数据库的备份恢复

2.6 vCenter Server数据库的备份恢复 vCenter Server所使用的数据库备份相当重要,一旦出现问题,vCenter Server将不能正常工作,所以日常备份工作是相当重要的,本 ...

春节快到了，越来越依赖网络购物的中国网民却发现

因为物流公司大多是社会基层人员,他们要过春节的欲望比任何人都要强烈.所以,在依托第三方物流的淘宝等网站买东西,要到节后发货,节前物流停止接单.这边厢,自建物流的京东却不失时机地打出了"春节无 ...

jQuery实现手机号码输入提示功能实例_jquery

本文实例讲述了jQuery实现手机号码输入提示功能的方法.分享给大家供大家参考.具体实现方法如下: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1 ...

使用NotePad++录制宏功能如何快速将sql搜索条件加上前后单引号_MsSql

當我們有很多筆的條件要對資料庫進行搜尋時,常常會用到下列的語法 SELECT * FROM Member WHERE accunt in ( 'Tom', 'John', 'May' ) 在上述語法 ...

js实现仿qq消息的弹出窗效果_javascript技巧

在我们的日常开发中,或者生活中,经常需要用到弹出窗.这里我们就用js模拟一下qq消息一样的弹出窗,分享给大家供大家参考,具体内容如下运行效果截图: 直接贴代码: <html> <h ...

jQuery对指定元素中指定字符串进行替换的方法_jquery

本文实例讲述了jQuery对指定元素中指定字符串进行替换的方法.分享给大家供大家参考.具体如下: 这段JS代码可以将指定id的元素内容的字符串进行替换,例如西面的代码将id=content元素中的jb ...

seo总结-新站百度收录实战分析

英文SEO测试的单页站包括一级域名和二级域名,从优化程度和网站内容质量上来讲,分为4种: 第一种:文章质量一般,优化痕迹较少或无优化痕迹. 案例: www.111cn.net 收录 www.111cn ...

关于flex里消息的传递

问题描述在一个application下有两个panel:panel1和panel2, panel1里有个button,当button被按下的时候,如何能够让panel2获得button被按下的消息? ...

关于黑洞的一切及那些悬而未决的问题

◆ ◆ ◆ 导读黑洞是一个非常奇怪的东西.它们是宇宙中最简单(只需要用质量.电荷.角动量三个数字就能描述任何一个黑洞),却又最费解的物体. 这个叫黑洞的什么家伙真的是一个大洞吗?实际上并不是,它是一 ...

传诺基亚Lumia920移动版与联通版售价曝光

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; [科技讯]11月12日消息,据媒体报道,亚马逊中国网站上今 ...

错误1053:服务没有及时响应启动或控制请求求帮忙

问题描述程序是在网上找的一个ICMP木马在虚拟机上测试的时候显示创建服务失败然后在服务里也没法启用提示就是错误1053:服务没有及时响应启动或控制请求求帮忙... 解决方案解决方案二:求大神指点啊 ...

九鼎“群狼”的赌局

潘沩 10月6日,乔布斯去世那天,九鼎投资一位员工碰巧在美国加州.得知这一消息后,他前往苹果总部门口自发的追悼现场,留下了自己的iPad,那里已经安放着几百部iPad和iPhone.随后他在微博上写道 ...

《产品经理的20堂必修课》一2.2　围绕用户需求创造产品价值

2.2 围绕用户需求创造产品价值产品经理的20堂必修课大多数的互联网产品都不是只有几个简单的功能,而是会包含几十个.几百个,甚至成千上万个大大小小的功能.换句话说,这些产品期望满足的用户需求都是非常 ...

集成UI中遇到的问题

问题描述 1.集成UI,遇到如下错误... 解决方案少添加依赖库了,对比一下demo.解决方案二:我集成UI之前,项目build成功了, 集成UI需要添加库吗,还有请问官方介绍了集成单聊,如何集成所 ...

热搜