MySQL · 特性分析 · MyRocks简介

RocksDB是facebook基于LevelDB实现的，目前为facebook内部大量业务提供服务。经过facebook大量工作，将RocksDB作为MySQL的一个存储引擎移植到MySQL，称之为MyRocks。
经过两年的发展，MyRocks已经比较成熟（RC阶段），现已进入了facebook MySQL的主分支了。MyRocks是开源的,参见git 。
下面对MyRocks做一个简单介绍，不涉及源码。

RocksDB与innodb的比较

innodb空间浪费, B tree分裂导致page内有较多空闲，page利用率不高。innodb现有的压缩效率也不高，压缩以block为单位，也会造成浪费。
写入放大：innodb 更新以页为单位，最坏的情况更新N行会更新N个页。RocksDB append only方式
另外，innodb开启double write也会增加写入。
RocksDB对齐开销小：SST file (默认2MB)需要对齐，但远大于4k, RocksDB_block_size(默认4k) 不需要对齐,因此对齐浪费空间较少
RocksDB索引前缀相同值压缩存储，节省空间
RocksDB占总数据量90%的最底层数据，行内不需要存储系统列seqid
（innodb聚簇索引列包含trxid,roll_ptr等信息）

来看看facebook的测试数据

数据空间对比

写入放大对比

数据字典

数据字段信息保存在System Column Family (System CF) “system“中
数据字段信息包括：

表信息，表名和index id的映射
索引信息，索引元数据信息和column family id。column family和index的对应关系 1:N
column family，一些标记，比如reverse属性等
binlog信息
统计信息，每个SST file都自带统计信息(行数、实际大小等),在flush或compaction时更新统计信息，同时统计信息会汇总到数据字典统计信息表中。

以上信息可以通过information_schema查看，如RocksDB_ddl,RocksDB_index_file_map等

记录格式

RocksDB的行以key value的形式存储，和innodb类似，记录格式主键和二级索引也有区别

事务与锁

MyRocks也是基于行锁，锁信息都保存在内存中。

MyRocks也支持MVCC，MVCC通过快照的方式实现，类似于PostgreSQL。

MyRocks目前只支持两种隔离级别，RC和RR。

RR表现和innodb并不一样，RocksDB 的快照不是在事务开始的时候建立，而是延迟到第一次读的时候建立.

以下client1 MyRocks返回的是2，innodb返回1

<client 1>                                               <client 2>
CREATE TABLE t1(pk INT PRIMARY KEY);
INSERT INTO t1 VALUES(1);
SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ;
                                                         SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ;
BEGIN
                                                         INSERT INTO t1 VALUES(2);
SELECT COUNT(*) FROM t1; // MyRocks返回的是2，innodb返回1

RC表现也不一样，事务1大更新多行过程中，其他事务也可以更新事务还未更新到的行，事务1再更新时会失败。

复制

MyRocks也是通过binlog方式复制，由于binlog与RocksDB之间没有xa，异常crash可能丢数据，所以，MyRocks主备环境建议开启semi-sync.
由于gap lock支持不健全(仅primary key上支持), 使用statement方式复制会导致不一致，所有MyRocks建议使用行级复制。

备份恢复

支持MySQLdumup逻辑备份

 #内部会执行以下语句
 SET TRANSACTION ISOLATION LEVEL REPEATABLE READ;
 START TRANSACTION WITH CONSISTENT RocksDB SNAPSHOT;

同时有自动的物理备份工具MyRocks_hotbackup，但还不支持备份innodb; 也不支持增量备份。MyRocks_hotbackup支持流式备份

  MyRocks_hotbackup--user=root --port=3306 --checkpoint_dir=/data/backup --stream=xbstream| ssh$dst‘xbstream–x /data/backup’
  #内部建立硬链接方式备份数据SST files,checkpoint多次更新，只备份新的SST files, 因此WAL日志很少，恢复时apply log时间很短
  SET GLOBAL RocksDB_create_checkpoint= /path/to/backup

一些优化

bloom filter
bloom filter一般适用于等值查询
bloom filter信息存储在SST files中，大概占用2~3%的空间
如果大量查询返回空集建议开启bloom filter,如果结果每次都在最底层找到，可以设置optimize_filters_for_hits=true关闭bloom filter以节省空间。
数据加载
数据加载时可以忽略唯一性约束检查，分段自动提交，停写wal等。
以下是推荐的数据加载时的参数配置

rocksdb_skip_unique_check=1
rocksdb_commit_in_the_middle=1
rocksdb_write_disable_wal=1
rocksdb_max_background_flushes=40
rocksdb_max_background_compactions=40
rocksdb_default_cf_options=(in addition to existing parameters); write_buffer_size=128m;level0_file_num_compaction_trigger=4;level0_slowdown_writes_trigger=256;level0_stop_writes_trigger=256;max_write_buffer_number=16;memtable=vector:1024
rocksdb_override_cf_options=(in addition to existing parameters);__system__={memtable=skip_list:16}

Reverse column families
MyRocks擅长正向扫描，为了提高逆向扫描（ORDER BY DESC）的性能，MyRocks支持了Reverse column families。在建表可以指定column family的reverse属性。
singleDelete
如果key不会重复put, delete操作可以直接删除put,而不是标记删除。singleDelete可以提供查询效率。

一些限制

MyRocks目前有以下一些限制

不支持分区表，Online ddl,外键，全文索引，空间索引，表空间transport
gap lock支持不健全(仅primary key上支持), 使用statement方式复制会导致不一致
不支持select … in share mode
大小写敏感，不支持*_bin collation
binlog与RocksDB之间没有xa，异常crash可能丢数据。所以，MyRocks一般开启semi-sync.
不支持savepoint
order by 不比较慢
不支持MRR
暂不支持O_DIRECT
innodb和RocksDB混合使用还不稳定

时间： 2024-08-24 16:41:56

MySQL · 特性分析 · MyRocks简介的相关文章

MySQL · 特性分析 · MDL 实现分析

前言在MySQL中,DDL是不属于事务范畴的,如果事务和DDL并行执行,操作相关联的表的话,会出现各种意想不到问题,如事务特性被破坏.binlog顺序错乱等,为了解决类似这些问题,MySQL在5.5.3引入了MDL锁(Metadata Locking),关于其设计思路可以参考这两个worklog:WL#3726 和 WL#4284.本篇从代码实现角度对MDL进行分析. 重要数据结构 MDL 是在 MySQL server 层实现的一个模块,通过对外接口和server层其它模块进行交互,在sql

MySQL · 特性分析 · InnoDB transaction history

1. 背景在写压力负载比较重的MySQL实例上, InnoDB可能积累了较长的没有被purge掉的transaction history,导致实例性能的衰减,或者空闲空间被耗尽,下面就来看看它是怎么产生的,或者有没有什么方法来减轻,避免这样的问题出现. 2. InnoDB purge概要 InnoDB是一个事务引擎,实现了MVCC特性,也就是在存储引擎里对行数据保存了多个版本.在对行数据进行delete或者update更改时,行数据的前映像会保留一段时间,直到可以被删除的时候. 在大部分OLT

MySQL · 特性分析 · innodb 锁分裂继承与迁移

innodb行锁简介行锁类型 LOCK_S:共享锁 LOCK_X: 排他锁 GAP类型 LOCK_GAP:只锁间隙 LOCK_REC_NO_GAP:只锁记录 LOCK_ORDINARY: 锁记录和记录之前的间隙 LOCK_INSERT_INTENTION: 插入意向锁,用于insert时检查锁冲突每个行锁由锁类型和GAP类型组成例如: LOCK_X|LOCK_ORDINARY 表示对记录和记录之前的间隙加排他锁 LOCK_S|LOCK_GAP 表示只对记录前的间隙加共享锁锁的兼容性: 值

MySQL · 特性分析 · MySQL 5.7 外部XA Replication实现及缺陷分析

MySQL 5.7 外部XA Replication实现及缺陷分析 MySQL 5.7增强了分布式事务的支持,解决了之前客户端退出或者服务器关闭后prepared的事务回滚和服务器宕机后binlog丢失的情况. 为了解决之前的问题,MySQL5.7将外部XA在binlog中的记录分成了两部分,使用两个GTID来记录.执行prepare的时候就记录一次binlog,执行commit/rollback再记录一次.由于XA是分成两部分记录,那么XA事务在binlog中就可能是交叉出现的.Slave端的

MySQL · 特性分析 · 浅谈 MySQL 5.7 XA 事务改进

关于MySQL XA 事务 MySQL XA 事务通常用于分布式事务处理当中.比如在分库分表的场景下,当遇到一个用户事务跨了多个分区,需要使用XA事务来完成整个事务的正确的提交和回滚,即保证全局事务的一致性. XA 事务在分库分表场景的使用下图是个典型的分库分表场景,前端是一个Proxy后面带若干个MySQL实例,每个实例是一个分区. 假设一个表test定义如下,Proxy根据主键"a"算Hash决定一条记录应该分布在哪个节点上: create table test(a int p

MySQL · 特性分析 · 企业版特性一览

背景 MySQL 企业版由 Oracle 公司维护,当然也是收费的.其产品类别也基本和 Oracle 数据库一致,包括标准版.企业版.集群版等.标准版包括基本的特性,价格也会比企业版便宜很多.今天和小编一起来看下 MySQL Enterprise Edition 提供的一些功能,这些功能的源码当然是不开源的,也是企业版的卖点. 企业级备份恢复备份备份工具提供 InnoDB 的联机在线备份,同时 MyISAM 引擎的备份会阻塞写入.联机备份是否阻塞应用,还要根据引擎的特性来定.这点上,Perc

MySQL · 特性分析 · Index Condition Pushdown (ICP)

前言上一篇文章提过,我们在之后的文章中会从 optimizer 的选项出发,系统的介绍 optimizer 的各个变量,包括变量的原理.作用以及源码实现等,然后再进一步的介绍优化器的工作过程(SQL 语句扁平化处理.索引选择.代价计算.多表连接顺序选择以及物理执行等内容),本期我们先看一下众所周知的 ICP,官方文档请参考这里. ICP 测试首先,咱们来看一下打开 ICP 与关闭 ICP 之间的性能区别,以下是测试过程: 准备数据: create table icp(id int, age

MySQL · 特性分析 · MySQL 5.7新特性系列一

1. 背景 MySQL 5.7在2015-10-21发布了GA版本,即5.7.9,目前小版本已经到了5.7.12.5.7新增了许多新的feature和优化,接下来一个系列,我们就一起来尝尝鲜.首先这次主要是预览feature的变化以及兼容性问题.后面的系列,会针对重要的feature展开来学习. 2 安全相关的特性 2.1 认证插件 mysql.user表中的plugin更改成not null,5.7开始不再支持mysql_old_password的认证插件,推荐全部使用mysql_native

MySQL · 特性分析 · 5.7 代价模型浅析

代价模型 mysql 5.7代价计算相对之前的版本有较大的改进.例如代价模型参数可以动态配置,可以适应不同的硬件区分考虑数据在内存和在磁盘中的代价代价精度提升为浮点型 jion计算时不仅要考虑condition,还要考虑condition上的filter,具体参见参数condition_fanout_filter 5.7 在代价类型上分为io,cpu和memory, 5.7的代价模型还在完善中,memory的代价虽然已经收集了,但还没有没有计算在最终的代价中. 5.7 在源码上对代价模型进

猜你喜欢

ASP内置对象Request和Response详解

基本教程篇--第八节PieSampleDemo.cs介绍

这节我把饼形图粗略的介绍一下,如下图. using System; using System.Drawing; using System.Collections; using ZedGraph; na ...

分离mysql和存储实现双web负载均衡

本文仅限涉及web服务器部分,至于负载均衡的实现可以按照需求来做,可以是基于DNS解析的负载均衡,也可以用lvs或者专用的负载均衡器(如F5或randware) 这是一个比较简单的负载均衡的实现,没有 ...

配置Windows Server 2008防火墙让系统更安全

相比Windows Server 2003操作系统中自带的防火墙,集成在Windows Server 2008下的防火墙功能更加全面,安全防护等级自然也是更高一筹,我们只要对该防火墙程序进行合适配置, ...

利用静态只读字段和静态构造函数提高性能

主要内容一句话概括: 把相对固定的数据在编译时仅通过查询一次数据库填充到公开的静态只读泛型集合类型字段中从而杜绝后续可能的数据库查询以提高性能. 相关背景:我们的应用程序中常常需要一些类似全国的省份列 ...

PS怎么制作文字遮罩效果?

PS怎么制作文字遮罩效果? 1.首先我们需要选取一个合适的底纹背景.打开图片素材,如图. 2.然后新建一个空白文件,尺寸及像素和底纹素材一致就可以了.方法:从预设选项中,选取底纹图片即可. 3.在 ...

Photoshop合成破碎有裂纹的模特头部效果

教程主要使用Photoshop合成破碎的模特,主要用到了素材的叠加,笔刷,钢笔和图层样式,下面让我们一起来学习吧. 先看效果图首先打开模特素材. 用钢笔做下图所示路径. 转为选区,反选,用图章工具修 ...

激光射线爆炸效果

1.如图: 2.用钢笔工具绘制一多边形 3.执行效果-扭曲和变换-收缩和膨胀 4.复制一个填充白色并缩小如图大小. 5.对红色图形执行效果-风格化-羽化. 6.对白色图形执行效果-扭曲和变换-粗糙 ...

笔记本电脑自动关机重启怎么办

笔记本电脑自动关机重启的解决方法一: 病毒木马解决方案:潜藏的病毒木马也能导致笔记本关机后自动重启,这时请将杀毒软件升级到最新版本,然后全盘查杀病毒木马 ACPI 高级电源选项设置错误解决方案 ...

如何解决电脑中出现的提示“未指定的错误”问题

如何解决电脑中出现的提示"未指定的错误"问题 1.新建一个文本文档到桌面,打开后将以下内容复制粘贴到文档中: Windows Registry Editor ...

Photoshop制作抽象混和时装效果图

在本教程中,您将学习如何转化为抽象的时装效果,使用Adobe Photoshop CS5混合一些自定义的形状和应用不同的混合模式.让我们开始吧! 最后的图象预览新建一个文件(CTRL+N)大小是 ...

UI陷阱！按钮总是看得到却点不到?

秘诀在于设定按钮的触控感应区(Touch area),按钮其实可以分为两个部分: 一.视觉目标(Visual targe)- 使用者可以看的到,并且想要去点击的区域. 二.触控感应区(Touch ...

Mac系统Flash无法安装怎么办

1.首先我们前往PC6.com/apple下载Adobe flash player for Mac的安装文件,如图所示. 2.在下载栏中找到下载的flash安装文件,打开它 3.在新弹出的 ...

Qt交叉编译出现icpc command not found，icpc是什么命令？

问题描述 Qt交叉编译出现icpc command not found,icpc是什么命令? 我买了4412的板子,然后打算交叉编译,我在Qt creator下,增加了一个Kits,编译器选择的是交叉 ...

唯快不破华为闪存让数据库快9倍

所谓"天下武功,唯快不破."在武侠的世界里,天下没有坚不可摧的武功,但当掌握了速度的优势,让速度达到极致的时候,往往能抵挡复杂的招式,立于武林不败之地. 在数字经济时代,如何在 ...

vb.net编写telnet的协商问题

问题描述我正在写个telnet,我这边的服务器协商代码是这样的:25525324255253322552533525525339我该怎么回答服务器啊解决方案解决方案二:路过帮顶========= ...

Hibernate整合Spring出现的异常，jar包全导了，就是不对啊

问题描述 org.springframework.beans.factory.BeanDefinitionStoreException:UnexpectedexceptionparsingXMLdoc ...

WPF-滑块开关式的CheckBox(横坚实例)

CheckBox竖向的滑块效果代码如下复制代码 <Style TargetType="{x:Type CheckBox}"> <Setter Pro ...

html5-HTML5 中canvas做背景上面怎么加入HTML的标单控件

问题描述 HTML5 中canvas做背景上面怎么加入HTML的标单控件利用canvas绘制了一个带有动态效果的背景,现在想要在上面加上表单控件,该怎么去做之前有思路是设置为 document.b ...

在link中使用codefirst制作一款《网盘软件》，订单管理怎么实现？

问题描述在link中使用codefirst制作一款<网盘软件>,订单管理怎么实现? 在link中使用codefirst制作一款<网盘软件>,订单管理怎么实现? 解决方案 ht ...

告别精品，坑爹网游霸占收费榜

11月17日,苹果宣布支持中国银联进行支付,19日更是启动了1元促销活动.不知道是不是巧合,今天多家媒体同时发布了类似的新闻,苹果推出1元价格区间范围以后,相关应用下载量出现了暴涨. 12倍!这是应用 ...

DCCI胡延平：电子商务未来属于消费者而非企业

第1页: 第2页: 和讯科技消息 10月17日,Eworld电子商务世界暨2012中国电子商务蓝皮书核心发布会在北京召开,本届大会将以"拨开迷雾-发现规律-问道蓝海"为主题,邀请了 ...

jquery Layer(弹窗/tips/confirm)插件使用教程

1.首先引用: <script src="../../js/common/layer/layer.js"></script> 2.消息提示tips: lay ...

建设高质量外链方法

1.填好最完美的账号信息我们做在注册百度账号的时候,填写账号信息要尽可能的完整,要尽可能凸显自己的权威性和专业性.这一点很多百度知道推广人员都不知道它的作用,或者知道了也会很少在意它的作用.百度不是 ...

Excel 表格添加 sheet

问题描述 Excel.Worksheetworksheet1=(Excel.Worksheet)workbook.Worksheets.Add(missing1,missing1,missing1,m ...

release生成后exe后，换个电脑，不能运行

问题描述如题,电脑上安装了框架,版本也是对的,崩溃信息看不懂.在写代码的电脑上运行是正常的.另外,直接把窗体加载过程的代码删除,目的是不运行我写的任何代码,生成exe,换电脑运行,还是崩溃,可见和我 ...

[手把手]教你绘制全球热门航线和客流分布图

摘要:这张地图描绘了一些目前最热门的民航线路,每条线路都用不同的颜色和宽度表示出了最近一年有多少乘客往返于这两个机场之间. 数据收集当我开始收集用于这张地图的数据时,我知道并不是所有的机场都在它的维 ...

asp.net中利用ajax获取动态创建表中文本框的值_实用技巧

假设现在主表为公司表(公司ID,公司名称,公司类型,公司规模),从表为部门表(部门ID,公司ID,经理,联系电话),现在一个公司有四个部门,要在同一个页面上录入公司信息以及四个部门的信息,如何动态创建 ...

mysqldump备份与还原mysql数据库

mysql 数据备份和恢复我们可以使用myql自带的工具 mysqldump .mysql‍ 来实现. mysqldump 支持远程单表备份.单数据库备份.所有数据库备份. ‍==备份== 注意空格 ...

雾霾里的安防新商机

据美通社讯,全球首款抗雾霾面霜--PM-zero Anti-Pollution Moisturizing Cream经过两年的研究在加拿大卡尔加里研制成功,是Aqua+ Skincare公司推出的首款 ...

热搜