事务隔离级别SI到RC以及优化

2017-08-20

谈事务一定会谈ACID,其中I是事务的隔离级别Isolation,这是一个老生常谈,却又不一定说得清楚的话题。

首先说RR和SI。RR和SI是一个差不多强度的隔离级别,RR有幻读问题,SI没有;而SI有写偏问题,RR没有。它们都解决了读未提交,不可重复读,然后都有对方处理不了的异常,所以算是差不多强度。只不过当年定义隔离级别的ANSI标准的时候,大家思维还局限在基于锁的实现,所以标准定义不是很完美,定义了RU,RC,RR,Serializability,后来基于MVCC的实现流行之后,才有了SI。

我们在MySQL里面执行下面这段代码:

mysql> begin;
Query OK, 0 rows affected (0.00 sec)
mysql> select * from t;
+------+
| id   |
+------+
|    1 |
|    2 |
+------+
2 rows in set (0.00 sec)
// 如果这期间有一个其它事务,往t里面插入了一行insert into t values (3);
mysql> update t set id = id + 1;
Query OK, 3 rows affected (0.00 sec)
Rows matched: 3  Changed: 3  Warnings: 0
// 哎呀,妈蛋!为什么Changed是3行,难道是我的幻觉么?
mysql> commit;
Query OK, 0 rows affected (0.00 sec)

这里的现象就是发生了幻读,MySQL的默认隔离级别是RR的,无法阻止幻读。同样的这段代码,在TiDB里面执行就不会有问题,因为TiDB的默认隔离级别其实是SI的,SI没有幻读。

接下来解释RR为什么阻止不了幻读,在基于锁的实现里面做RR,处理读写冲突,锁只会加到写操作涉及到的那些行上面,新插入进去的3不会被加上写锁。如果真想处理这种异常就需要锁全表才行。 而在基于MVCC实现的SI里面,由于有多版本,更新操作看到的都是老版本数据,修改的也是老版本数据,新插入的3它是看不到的,所以不会出现幻读。

再看一个例子,假设当前的表是这样子:

mysql> select * from t;
+------+
| id   |
+------+
|    1 |
|    2 |
+------+
2 rows in set (0.00 sec)

事务A,如果它读到一个值是1的id,那么它就把id 2更新到42。

mysql> begin;
Query OK, 0 rows affected (0.00 sec)
mysql> select * from t where id = 1;
+------+
| id   |
+------+
|    1 |
+------+
1 row in set (0.01 sec)
mysql> update t set id = 42 where id = 2;
Query OK, 1 row affected (0.00 sec)
mysql> commit;
事务B,如果它读到一个值是2的id,那么它就把id 1更新到42。
mysql> begin;
Query OK, 0 rows affected (0.00 sec)
mysql> select * from t where id = 2;
+------+
| id   |
+------+
|    2 |
+------+
1 row in set (0.00 sec)
mysql> update t set id = 42 where id = 1;
Query OK, 1 row affected (0.01 sec)
mysql> commit;
Query OK, 0 rows affected (0.00 sec)

在可串行化条件下,事务A和事务B是不能够两者都执行成功的。即使在RR隔离级别里面,也是不能执行成功的。但是在TiDB里面可以执行成功,这就是SI不能处理的写偏(write skew)问题。 为什么SI不能处理写偏呢?因为MVCC里面读是不会将数据锁住的,导致当在一个事务读A写B,另一个事务读B写A的情况下,无法检查到读写冲突。如果想实现可串行化,必须采取某种方式破坏掉这种,读写在不同变量上,并且形成环的情况。

(写到这里突然想起来贵司的时候,聊到过write skew问题。聊了哪些细节记不太清了,记得有问到读不加锁,如果一个事务先读,而另一个事务写并且提交了,读操作岂不读到脏数据?...顺便八卦一下,当时的面试是首席架构师+CEO+CTO,现在新同学过来想要凑齐这么豪华的阵容应该是很难了)

其实之前的文章里面也有提到过隔离级别,为什么又想起写一篇呢?因为最近思考了一下,降低隔离级别到RC,可能带来的优化。

SI的实现,需要拿一次startTS和一次commitTS。快照读需要读到比startTS小的最近的一个commit的数据。如果拿时间戳要从一个中心化的授时服务里面拿的,拿两次时间戳得走两次网络,对于简单的query,这个开销是造成延迟的大头之一。所以TiDB里面做过的一个优化,这个优化是这样的,对于简单点查事务,我们只需要读到当时的最新的数据(简单点查不需要处理可重复读)。为了读到最新,我们直接使用一个无穷大的数当作startTS就可以,那么就并不需要去拿startTS。

另外一个优化是生成查询计划和拿startTS操作并行做,反正在执行器执行之前,都不会需要用到startTS,只有到二阶段提交的时候才用需要,所以可以并行化。

在RC隔离级别下,快照读操作即使遇到了锁,仍然是可以继续读的,而SI不行。所以冲突严重的情况下,RC隔离级别由于读写不冲突了,性能会进一步提高。还有没有办法继续优化?

我最近突然想到的一个点是:RC隔离级别并不需要拿startTS

先看RC级别下的读操作:读遇到锁可以忽略,并且不需要读到比startTS小的最近的那个版本,只需要读到的是已提交的。反正不需要满足可重复读,一直读最新的就好了,所以可以不拿startTS,直接传一个无穷大的数当startTS就可以。

接着我们看写操作,如果写操作不拿startTS会发生什么事情?写操作在prewrite的时候会先写锁,并且将startTS信息记录在锁里面。如果不拿startTS了,锁仍然还是可以写的,里面没有startTS信息而已。这个锁还是可以阻止写写冲突的,这就足够了。那么,startTS原本用来做什么的呢?除了可以判断大小,锁里面记录这个信息的作用是判定锁是由哪个事务加上的。到时候事务提交时清锁,就知道该如何清掉属于自己的锁。如果没了startTS作为事务的identify,那么我们还是需要记录一些东西来区分锁是谁加上的。这个用其它方式应该是可以实现的,UUID都可以考虑,细节不展开了。

所以结论是基于写写锁+MVCC读写,可以实现出RC隔离级别事务,并且只有写事务提交才需要拿一次时间戳。

做这个优化会带来什么问题么?

如果写操作不拿startTS,那么首先这是一个不能够SI/RC同时兼容的。比如某些session跑在SI隔离级别,而另一些session跑在RC隔离级别,最后写到存储里面数据不统一,有的写startTS有的不写,数据就坏了。这个问题可以通过禁用session级别,只允许global级别设置RC隔离级别解决,只要大家都跑在RC上就没问题。

另外一个是RC隔离级别不能阻止的一些异常。首先RC是不可重复读的,RC达不到RR这个很好理解,关键区别就在于startTS,(每次读新版本)跟(读比startTS小的最新版本)决定了是否可重复读。

还有一个丢失写(lost update)问题,在下面这个时序,x的初始值是100。事务2将x写成120并提交,事务1将x写成130并提交:

r1[x=100] r2[x=100] w2[x=120] c2 w1[x=130] c1

对于事务2来说,它提交了,但它的写也丢失了:从串行化的角度,事务1本该看到的是事务2写的结果120,然而事务1看到的却是100。

在用读写锁实现RR隔离级别的时候可以处理这种情况,是因为w2[x]的时候会被r1[x]的锁阻止。在基于MVCC实现的隔离级别里面也不会遇到丢失写异常,当事务1提交的时候,它会检测到在它解锁期间,有更大的TS的数据(来自事务1的)写入,然后提交失败。然而在上面用写写锁+MVCC读写实现RC,是不能够处理丢失写的。

有一个影响使用的场景,TiDB里面分配唯一ID。在SI隔离级别下,可以保证(读然后写)的事务之间,是没有重叠区域的。也是因为有startTS,下面那个事务begin的时候,把startTS写进去,于是上面执行到w1就会检查到读写冲突。在RC隔离级别不写startTS的情况下,读写不冲突了便会重叠,这样子分配唯一ID就无法实现了。

  [r1 -------------- w1]
          [r2 ----------------- w2]

大概就这些吧。最后出个题,在SI实现里,两阶段提交在prewrite操作的时候没有遇到锁,但是遇到了rollback的记录,并且rollback记录的ts是大于当前事务的ts的,这是否算冲突?能否忽略这条rollback?做了什么操作时序,可能遇到这样的情况?

这篇文章思路是这样的:

  • 比较了一下SI和RR隔离级别
  • 将SI退化到RC,能否有一些性能优化的空间,不拿startTS
  • 基于写写锁+MVCC无锁读写实现RC隔离级别
  • 实现成RC会有什么样的问题

个人感触,其实事务隔离级别这个东西,想深入理解最好的办法其实是自己实现某一种,比如RR或者SI,然后再去对比和思考其它各种,比如RC或者可串行化,如何实现,以及可能的优化,做一做权衡。

transactionisolationSIRC

HNS.to is a highly insecure way of browsing Handshake domains and should only be used for demo or educational purposes. Click to see preferable resolutions methods