在隔离机制中,InnoDB默认采用的Repeatable Read 和MVCC机制保证在事务内部尽量保证逻辑一致性。但如下的现象依然让人觉得不太合理。
1、复现
a) 表结构
CREATE TABLE `t` (
`a` int(11) NOT NULL DEFAULT ‘0′,
`b` int(11) DEFAULT NULL,
PRIMARY KEY (`a`)
) ENGINE=InnoDB DEFAULT CHARSET=gbk
表中2条记录
| 1 | 100 |
| 4 | 400 |
+—+——+
b) 操作过程:开两个session,操作序列如下
Session 1 | Session 2 |
1)Begin | |
2)Select * from t; | 1 | 100 | | 4 | 400 | 2 rows in set (0.01 sec) |
|
3)Insert into t vlaues(2, 200); | |
4)Select * from t; | 1 | 100 | | 4 | 400 | 2 rows in set (0.01 sec) |
|
5)Update t set b = 200 where a = 2; Query OK, 0 rows affected (0.01 sec) Rows matched: 1 Changed: 0 Warnings: 0 |
|
6)Select * from t; | 1 | 100 | | 2 | 200 | | 4 | 400 | 3 rows in set (0.01 sec) |
从session 1整个过程看来,它试图更新一个不存在的记录(a=2),结果更新成功,并且之后这个记录可以访问。
2、分析
从其他正常的表象看来,在事务内,只要不涉及更新,事务外的任何更新都是不可见的。上面试验中session 1内update之前执行的select *得到的结果仍是2条记录。
虽然更新冲突时的策略见仁见智,但例子中的这个现象应该提供一种可以选择的方式(至少应该允许配置)。
接下来的篇幅主要分析出现这种现象的原因,以及通过简单修改实现如下的方式:对于查询不可见的记录,update操作不应该成功。
由于更新冲突策略的复杂性,本文不解决更多的问题,简单比如:insert操作由于主键冲突的原因,插入依旧不允许。
3、源码相关
先来说明一下为什么步骤4)中的查询结果仍为2条记录。
Innodb内部每个事务开始时,都会有一个事务id, 同时事务对象中还有一个read_view变量,用于控制该事务可见的记录范围(MVCC)。对于每个访问到的记录行,会根据read_view的trx_id(事务id)与行记录的trx_id比较,判断记录是否逻辑上可见。
Session 2中插入的记录不可见,原因即为session 1先于session 2,因此新插入的数据经过判断,不在可见范围内。对应的源码在row/row0sel.c [4040-4055].
{说明: 源码版本5.1.45, 下同}
发生的逻辑为
If(!lock_clust_rec_cons_read_sees(..)){ //检查该记录是否本事务可见 row_sel_build_prev_vers_for_mysql(….); //不可见则找上一个版本 if (old_vers == NULL) {goto next_rec;} //上一个版本没有这个记录,放弃 } |
注意到表格中出现的Rows matched: 1。 这里是例子出现诡异的开始,也是根源。我们知道innoDB内部更新数据实际上是“先查后改”,跟这个Rows matched: 1结合起来,不难联想到,在执行update操作是,在“查”的阶段,事务能够访问到新插入的行。
猜测:问题出在,执行更新的时候,是否没有判断事务可见范围?
事实上确实如此,源代码上翻几行可以看到,在行数[3897-4017-4071]这个if-else逻辑。
if (prebuilt->select_lock_type != LOCK_NONE) { //该操作需要加锁 } else{ //{CODES A} } |
执行查询语句走的是else的逻辑,而控制版本可见范围的代码就在{CODES A}的位置中。
而当我们在session 1中执行update操作时,走的是if()的逻辑,这里,没有判断版本可见范围。
4、简单修改
既然是因为update的“查”过程没有检查版本可见范围造成,我们试着加上。
在row/row0sel.c[3907]行插入如下:
if(trx->read_view){ if (UNIV_LIKELY(srv_force_recovery < 5) && !lock_clust_rec_cons_read_sees(rec, clust_index, offsets, trx->read_view)) { rec_t* old_vers; err = row_sel_build_prev_vers_for_mysql( trx->read_view, clust_index, prebuilt, rec, &offsets, &heap, &old_vers, &mtr); if (err != DB_SUCCESS) { goto lock_wait_or_error; } if (old_vers == NULL) { goto next_rec; } } } |
新的执行结果为
Session 1 | Session 2 |
1)Begin | |
2)Select * from t; | 1 | 100 | | 4 | 400 | 2 rows in set (0.01 sec) |
|
3)Insert into t vlaues(2, 200); | |
4)Select * from t; | 1 | 100 | | 4 | 400 | 2 rows in set (0.01 sec) |
|
5)Update t set b = 200 where a = 2; Query OK, 0 rows affected (0.01 sec) Rows matched: 0 Changed: 0 Warnings: 0 |
|
6)Select * from t; | 1 | 100 | | 4 | 400 | 2 rows in set (0.01 sec) |
重申:这个修改仅仅从本文的例子出发,达到“事务内查询无法访问的记录,不能更新”这个目的, 其他更新冲突策略不在此范围内。 仅作交流使用 -_-