Mvcc 多版本并发控制

image.png

数据库事务的隔离级别

  • 读未提交
  • 读已提交 解决了脏读的问题
  • 可重复读(mysql 默认隔离级别)
  • 串行化(解决了幻读的问题)

为什么需要Mvcc

并发事务处理可能会出现几种情况

  1. 更新丢失
  2. 脏读
  3. 不可重复读
  4. 幻读 在一个事务中,查询同一个值结果不一样

实现隔离方法的主要方式

  1. 加读写锁
  2. 一致性快照读

Innodb mvcc 原理

image.png

innodb中,每行记录都有隐藏列
每一行记录都有两个隐藏列: DATA_TRX_ID 、 DATA_ROLL_PTR

DATA_TRX_ID
记录最近更新这条行记录的 事务 ID ,大小为 6 个字节
DATA_ROLL_PTR
表示指向该行回滚段 (rollback segment) 的指针,大小为 7 个字节, InnoDB 便是通过这个指针找到之前版本的数据。该行记录上所有旧版本,在 undo 中都通过链表的形式组织。

image.png

ReadView

已提交读和可重复读的区别就在于它们生成ReadView的策略不同

举个例子 ,在已提交读隔离级别下:
比如此时有一个事务id为100的事务,修改了name,使得的name等于小明2,但是事务还没提交。则此时的版本链是
image.png
那此时另一个事务发起了select 语句要查询id为1的记录,那此时生成的ReadView 列表只有[100]。那就去版本链去找了,首先肯定找最近的一条,发现trx_id是100,也就是name为小明2的那条记录,发现在列表内,所以不能访问。
这时候就通过指针继续找下一条,name为小明1的记录,发现trx_id是60,小于列表中的最小id,所以可以访问,直接访问结果为小明1。
那这时候我们把事务id为100的事务提交了,并且新建了一个事务id为110也修改id为1的记录,并且不提交事务
image.png
这时候版本链就是

image.png
这时候之前那个select事务又执行了一次查询,要查询id为1的记录。
这个时候关键的地方来了
如果你是已提交读隔离级别,这时候你会重新一个ReadView,那你的活动事务列表中的值就变了,变成了[110]。
按照上的说法,你去版本链通过trx_id对比查找到合适的结果就是小明2。
如果你是可重复读隔离级别,这时候你的ReadView还是第一次select时候生成的ReadView,也就是列表的值还是[100]。所以select的结果是小明1。所以第二次select结果和第一次一样,所以叫可重复读!

也就是说已提交读隔离级别下的事务在每次查询的开始都会生成一个独立的ReadView,而可重复读隔离级别则在第一次读的时候生成一个ReadView,之后的读都复用之前的ReadView。

这就是Mysql的MVCC,通过版本链,实现多版本,可并发读-写,写-读。通过ReadView生成策略的不同实现不同的隔离级别。