MySQL · TokuDB · TokuDB 中的行锁

前言

4月份月报有篇文章《行锁(row-lock)与区间锁(range-lock)》,介绍了 TokuDB 的行锁/区间锁是如何使用的。这篇文章是其姐妹篇,介绍TokuDB行锁的实现,大家可以对照着看。

行锁申请

与 InnoDB 类似,TokuDB 也支持行级锁用来协调多个 txn 对数据库表某一段数据的并发访问。一个表中所有已经 grant 的行锁是用一个 binary search tree 来表示的,TokuDB 的术语称它为 lock tree。lock tree 与数据库表之间是一一对应的关系。当打开 cursor 读写 TokuDB 数据库的时候,需要首先尝试申请row lock,成功后再调用 db_put/ha_tokudb::read_range_first 方法来读写数据。TokuDB 的 row lock 是用 range lock 表示的,一个 range lock 代表按key值连续的一个行锁区间。rangelock是一个同步锁,如果获取成功立即返回;若失败则会同步等待若干时间,等待超时整个操作就会失败返回。range lock的申请分为三个阶段,下面将逐个说明。

  1. 创建range lock:在TokuDB中就是创建一个 lock_request 对象
    创建的过程很简单,主要是初始化,创建成功后调用 lock_request 的 start 函数来申请锁;
  2. 申请range lock:大部分事情都在这个阶段完成的
    申请锁的时候需要指定五元组(lt,txn,type,left_key,right_key),分别表示数据库表对应的lock tree,txn结构,锁类型(read/write),键值区间(left_key, right_key)。申请的时候会根据锁 类型来调用 locktree 的 acquire_write/read_lock方法来获取锁。这里有个 tricky 的地方:在 locktree 实现中隐式地将 read lock 升级成 write lock。
    在获取锁的函数里面,首先调用了 check_current_lock_constraints 来进行 throttle 控制当前锁占用的内存,这块不展开讨论了。
    locktree 有一个为 single txn 做的优化,当系统猜测当前是工作在 single txn 的方式下(不存在锁竞争的问题),所有的锁都会被 grant 并记录在 sto_buffer 里面。如果不是 single txn 的模式,已经 grant 的锁则保存在 concurrent_tree 里面,这个就是我们在前面提到的那个 binary search tree。Single txn 模式的判断是用启发式的方法,由两个因素控制 sto_buffer 和 concurrent_tree 的切换: 积分 score 和 sto_buffer 长度,因篇幅有限这块也留给大家分析了。要提的一点是如果正处在 single txn 模式,遇到了一个新的 txn,那么 sto_buffer 的锁会被转移到 concurrent_tree 上。
    我们重点讨论是 concurrent_tree 的情况。函数 acquire_lock_consolidated 会根据五元组里面的 left_key 和 right_key 构造一个 request_range,然后用这个 range 在 concurrent_tree 上定位到与它存在 overlap 关系的最小子树,并把子树里面与 request_range 存在 overlapped 关系的那些锁保存在一个变长数组里面。然后 iterate 这个数组看看是否存在锁冲突,冲突的条件是与五元组里的 txnid 不同但锁区间是 overlapped 的。如果不存在锁冲突,就可以立即 grant 这个锁申请了。
    剩下的是些维护工作,就是依次把区间重叠的已经 grant 的锁和我们正在申请的锁进行区间 merge,保证 concurrent_tree 里面的所有锁的区间都是不相交的(不overlapped的)。如果不幸,申请的锁和concurrent_tree里面的锁有冲突,那么请求操作会失败。
  3. 等待range lock:申请失败会把这个 range lock 放到 locktree 的 pending list 里等待以后重试。
    锁申请失败可能是发生了死锁,还需要调用 deadlock_exists 递归构造锁等待 DAG 图判断是否真的发生了死锁。

举例说明

上面描述比较枯燥,我们结合4月份月报里的例子一起看看吧。

mysql> show create table t\G
--------------------------- 1. row ---------------------------
       Table: t
Create Table: CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=TokuDB DEFAULT CHARSET=latin1

mysql> set autocommit=off;
mysql> insert into t values (1),(10),(100);
mysql> select * from information_schema.tokudb_locks\G
--------------------------- 1. row ---------------------------
               locks_trx_id: 238
      locks_mysql_thread_id: 3
              locks_dname: ./test/t-main
             locks_key_left: 0001000000
            locks_key_right: 0001000000
        locks_table_schema: test
          locks_table_name: t
locks_table_dictionary_name: main
--------------------------- 2. row ---------------------------
               locks_trx_id: 238
      locks_mysql_thread_id: 3
             locks_dname: ./test/t-main
             locks_key_left: 000a000000
            locks_key_right: 000a000000
         locks_table_schema: test
           locks_table_name: t
locks_table_dictionary_name: main
--------------------------- 3. row ---------------------------
               locks_trx_id: 238
      locks_mysql_thread_id: 3
              locks_dname: ./test/t-main
             locks_key_left: 0064000000
            locks_key_right: 0064000000
         locks_table_schema: test
           locks_table_name: t
locks_table_dictionary_name: main

再看一个例子。id 是 primary key,c1 上有 index 。Insert 三条记录产生6个行锁,3个在primary key上,3个在c1 index上。primary key上锁的key值主要由pk值构成,非 unique 的 index 锁的 key 值主要由 index 上的 key 值和 primary key 值组成。

Create Table: CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `c1` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `c1` (`c1`)
) ENGINE=TokuDB DEFAULT CHARSET=latin1
1 row in set (0.00 sec)

mysql> alter table t2 add index (c1);
mysql> set autocommit=off;
mysql> insert into t values(1,2),(10,11),(100,101);
mysql> select * from information_schema.tokudb_locks\G
--------------------------- 1. row ---------------------------
               locks_trx_id: 451
      locks_mysql_thread_id: 1
             locks_dname: ./test/t-main
             locks_key_left: 0001000000
            locks_key_right: 0001000000
         locks_table_schema: test
           locks_table_name: t
locks_table_dictionary_name: main
--------------------------- 2. row ---------------------------
               locks_trx_id: 451
      locks_mysql_thread_id: 1
             locks_dname: ./test/t-main
             locks_key_left: 000a000000
            locks_key_right: 000a000000
         locks_table_schema: test
           locks_table_name: t
locks_table_dictionary_name: main
--------------------------- 3. row ---------------------------
               locks_trx_id: 451
      locks_mysql_thread_id: 1
             locks_dname: ./test/t-main
             locks_key_left: 0064000000
            locks_key_right: 0064000000
         locks_table_schema: test
           locks_table_name: t
locks_table_dictionary_name: main
--------------------------- 4. row ---------------------------
               locks_trx_id: 451
      locks_mysql_thread_id: 1
             locks_dname: ./test/t-key-c1
             locks_key_left: 00010200000001000000
            locks_key_right: 00010200000001000000
         locks_table_schema: test
           locks_table_name: t
locks_table_dictionary_name: key-c1
--------------------------- 5. row ---------------------------
               locks_trx_id: 451
      locks_mysql_thread_id: 1
             locks_dname: ./test/t-key-c1
             locks_key_left: 00010b0000000a000000
            locks_key_right: 00010b0000000a000000
         locks_table_schema: test
           locks_table_name: t
locks_table_dictionary_name: key-c1
--------------------------- 6. row ---------------------------
               locks_trx_id: 451
      locks_mysql_thread_id: 1
             locks_dname: ./test/t-key-c1
             locks_key_left: 00016500000064000000
            locks_key_right: 00016500000064000000
         locks_table_schema: test
           locks_table_name: t
locks_table_dictionary_name: key-c1

问题探讨

前面描述中提到 locktree 会自动升级读锁为写锁,这会不会带来性能问题呢?我看看下面的例子,假设场景是 isolation 级别是 read commit,关闭autocommit。

例1:

  • txn1: select 执行 index range scan ==> 在 read_range_first 之前会尝试获取读锁 ==> locktree 自动把读锁升级为写锁
  • txn2: select 执行 index range scan,与 txn1 相同的 index,数据有 overlapped ==> 在 read_range_first 之前会尝试获取读锁 ==> locktree 自动把读锁升级为写锁

例2:

  • txn3: select 执行 index range scan ==> 在 read_range_first 之前会尝试获取读锁 ==> locktree 自动把读锁升级为写锁
  • txn4: insert 插入的数据落在 txn3 操作的区间内 ==> 在 db_put 之前会尝试获取写锁 ==> locktree 获取写锁

这样看起来 txn1 与 txn2,txn3 与 txn4 申请的 rangelock 存在 overlapped 关系,可能引起等待。但事实上,在 read commit 的隔离级别上,txn1&txn2,tx3&txn4 是不需要等待的。

TokuDB 中读数据申请 row lock 是在 c_set_bounds 函数实现的。c_set_bounds 有个tricky的处理:对于 READ_UNCOMMITTED,READ_COMMITTED 和 REPEATABLE_READ 隔离级别下并且没有设置 DB_RMW 标志的话,读数据是不需要去拿 range lock 的。

时间: 2024-08-29 02:41:10

MySQL · TokuDB · TokuDB 中的行锁的相关文章

MySQL中的行级锁、表级锁、页级锁_Mysql

在计算机科学中,锁是在执行多线程时用于强行限制资源访问的同步机制,即用于在并发控制中保证对互斥要求的满足. 在DBMS中,可以按照锁的粒度把数据库锁分为行级锁(INNODB引擎).表级锁(MYISAM引擎)和页级锁(BDB引擎 ). 一.行级锁 行级锁是Mysql中锁定粒度最细的一种锁,表示只针对当前操作的行进行加锁.行级锁能大大减少数据库操作的冲突.其加锁粒度最小,但加锁的开销也最大.行级锁分为共享锁 和 排他锁. 特点 开销大,加锁慢:会出现死锁:锁定粒度最小,发生锁冲突的概率最低,并发度也

MySQL中的行级锁,表级锁,页级锁

在计算机科学中,锁是在执行多线程时用于强行限制资源访问的同步机制,即用于在并发控制中保证对互斥要求的满足. 在数据库的DBMS中,可以按照锁的粒度把数据库锁分为行级锁(INNODB引擎).表级锁(MYISAM引擎)和页级锁(BDB引擎 ). 行级锁 行级锁是Mysql中锁定粒度最细的一种锁,表示只针对当前操作的行进行加锁.行级锁能大大减少数据库操作的冲突.其加锁粒度最小,但加锁的开销也最大.行级锁分为共享锁和排它锁(MySQL中的共享锁与排他锁) 特点 开销大,加锁慢:会出现死锁:锁定粒度最小,

TokuDB行锁的实现

本文发表于2015-11的Mysql内核月报  行锁申请 与 InnoDB 类似,TokuDB 也支持行级锁用来协调多个 txn 对数据库表某一段数据的并发访问.一个表中所有已经 grant 的行锁是用一个 binary search tree 来表示的,TokuDB 的术语称它为 lock tree.lock tree 与数据库表之间是一一对应的关系.当打开 cursor 读写 TokuDB 数据库的时候,需要首先尝试申请row lock,成功后再调用 db_put/ha_tokudb::re

TokuDB · 特性分析 · 行锁(row-lock)与区间锁(range-lock)

简介 TokuDB使用LockTree(ft-index/locktree)来维护事务的锁状态(row-lock和range-lock),LockTree的数据结构是一个Binary Tree.  本篇将通过几个"栗子"来谈谈TokuDB的row-lock和range-lock.  表t: mysql> show create table t\G *************************** 1. row *************************** Tabl

RDS for MySQL InnoDB 行锁等待和锁等待超时的处理

RDS for MySQL InnoDB 行锁等待和锁等待超时的处理   1. InnoDB 引擎表行锁等待和等待超时发生的场景 2.InnoDB 引擎行锁等待情况的处理 2.1 InnoDB 行锁等待超时参数 innodb_lock_wait_timeout 2.2 大量行锁等待和行锁等待超时的处理 1. InnoDB 引擎表行锁等待和等待超时发生的场景 当一个 RDS for MySQL 连接会话等待另外一个会话持有的互斥行锁时,会发生 InnoDB 引擎表行锁等待情况. 通常情况下,持有该

MySQL的事务隔离级别和锁

MySQL的事务隔离级别:Read Uncommitted[读未提交数据]Read Committed[读已提交数据]Repeatable Read[可重读]Serializable[可串行化] 查看MySQL的事务隔离级别:默认.全局和会话事务隔离级别: SELECT @@tx_isolation SELECT @@global.tx_isolation; SELECT @@session.tx_isolation; mysql> select @@tx_isolation; +-------

Mysql事务,并发问题,锁机制-- 幻读、不可重复读(转)

1.什么是事务 事务是一条或多条数据库操作语句的组合,具备ACID,4个特点. 原子性:要不全部成功,要不全部撤销 隔离性:事务之间相互独立,互不干扰 一致性:数据库正确地改变状态后,数据库的一致性约束没有被破坏 持久性:事务的提交结果,将持久保存在数据库中   2.事务并发会产生什么问题 1)第一类丢失更新:在没有事务隔离的情况下,两个事务都同时更新一行数据,但是第二个事务却中途失败退出, 导致对数据的两个修改都失效了. 例如: 张三的工资为5000,事务A中获取工资为5000,事务B获取工资

MySQL存储引擎中的MyISAM和InnoDB区别详解_Mysql

在使用MySQL的过程中对MyISAM和InnoDB这两个概念存在了些疑问,到底两者引擎有何分别一直是存在我心中的疑问.为了解开这个谜题,搜寻了网络,找到了如下信息: MyISAM是MySQL的默认数据库引擎(5.5版之前),由早期的ISAM(Indexed Sequential Access Method:有索引的顺序访问方法)所改良.虽然性能极佳,但却有一个缺点:不支持事务处理(transaction).不过,在这几年的发展下,MySQL也导入了InnoDB(另一种数据库引擎),以强化参考完

MySQL存储引擎中MyISAM和InnoDB区别详解_Mysql

InnoDB和MyISAM是许多人在使用MySQL时最常用的两个表类型,这两个表类型各有优劣,视具体应用而定.基本的差别为:MyISAM类型不支持事务处理等高级处理,而InnoDB类型支持.MyISAM类型的表强调的是性能,其执行数度比InnoDB类型更快,但是不提供事务支持,而InnoDB提供事务支持以及外部键等高级数据库功能. 以下是一些细节和具体实现的差别: ◆1.InnoDB不支持FULLTEXT类型的索引. ◆2.InnoDB 中不保存表的具体行数,也就是说,执行select coun