MySQL

一、场景还原

在线上代码中使用了Mybatis-plus的如下方法

  1. com.baomidou.mybatisplus.extension.service.IService
  2. saveOrUpdate(T, com.baomidou.mybatisplus.core.conditions.Wrapper<T>)

该方法先执行了update操作,如果更新到就不再执行后续操作,如果没有更新到,才进行主键查询,查询到了就修改,未查询到就新增。具体方法如下

  1. /**
  2. * <p>
  3. * 根据updateWrapper尝试更新,否继续执行saveOrUpdate(T)方法
  4. * 此次修改主要是减少了此项业务代码的代码量(存在性验证之后的saveOrUpdate操作)
  5. * </p>
  6. *
  7. * @param entity 实体对象
  8. */
  9. default boolean saveOrUpdate(T entity, Wrapper<T> updateWrapper) {
  10. return update(entity, updateWrapper) || saveOrUpdate(entity);
  11. }

那么这个方法的做法,为什么会导致间隙锁死锁呢?一起来分析并还原间隙锁死锁的场景。

二、什么是间隙锁

间隙锁是MySQL行锁的一种,与行锁不同的是间隙锁可能锁定的是一行数据,也可能锁住一个间隙。锁定规则如下:

  • 当修改的数据存在时,间隙锁只会锁定当前行。
  • 当修改的数据不存在时,间隙锁会向左找第一个比当前索引值小的值,向右找第一个比当前索引值大 的值(没有则为正无穷),将此区间锁住,从而阻止其他事务在此区间插入数据。

    三、间隙锁的作用

    与行锁(例如乐观锁高级实现,MVCC)组合成Next-key lock,在可重复读这种隔离级别下一起工作避免幻读。

    四、如何关闭间隙锁(强烈不建议关闭)

    1、降低隔离级别,例如降为提交读。
    2、直接修改my.cnf,将开关,innodb_locks_unsafe_for_binlog改为1,默认为0即开启

    五、还原线上间隙锁死锁的场景

    5.1 复现间隙锁死锁

    5.1.1 先准备一个表

    1. mysql> select * from t_gap_lock;
    2. +----+--------+------+
    3. | id | name | age |
    4. +----+--------+------+
    5. | 1 | 张一 | 21 |
    6. | 5 | 李五 | 25 |
    7. | 6 | 赵六 | 26 |
    8. | 9 | 王九 | 29 |
    9. | 12 | 十二 | 12 |
    10. +----+--------+------+

    表中的id数据咱们准备了三个间隙:

  • 间隙一:1-5

  • 间隙二:6-9
  • 间隙三:12-正无穷

    5.1.2 操作

    1、此时开启事务一,然后执行更新id=3的数据,按照咱们的理论,id=3这个数据不存在,说明它会在1-5之间加间隙锁。 ```sql

    开启事务一

    begin;

事务一在1-5之间加间隙锁

update t_gap_lock t set t.age = 23 where t.id = 3;

  1. 2、然后开启事务二,然后执行更新id=7的数据,按照咱们的理论,id=7这个数据不存在,说明它会在6-9之间加间隙锁
  2. ```sql
  3. #开启事务二
  4. begin;
  5. #事务二在6-9之间加间隙锁
  6. update t_gap_lock t set t.age = 27 where t.id = 7;

3、那么重点来了,此时需要做的操作就是让事务一在6-9之间插入数据,会发现此时事务已经被阻塞,无法执行insert,因为事务二已经对该区间加了间隙锁。

  1. #事务一在6-9之间插入数据
  2. insert into t_gap_lock(id, name, age) values(8,'李八',28);

4、在事务一等待锁的同时,咱们让事务二同时在1-5之间插入数据,这个时候会发现,只要事务二一执行插入。MySQL立即报了死锁,就会见到如下提示:`[40001][1213] Deadlock found when trying to get lock; try restarting transaction。

  1. # 同时事务二在1-5之间插入数据
  2. insert into t_gap_lock(id, name, age) values(3,'李三',23);

5.1.3 整个死锁过程进行原理分析

1、首先事务一开启事务后,更新id=3的数据,此数据不存在,所以事务一会锁住1-5这个间隙,即为1-5这个间隙添加间隙锁,同理,事务二会为6-9这个间隙添加间隙锁;
2、然后让事务一在6-9这个间隙插入数据,因为事务二已经加了间隙锁,所以事务一需要等待事务二释放间 隙锁才能进行插入操作,此时事务一等待事务二释放间隙锁;
3、同理,事务二在1-5间隙插入时需要等待事务一释放间隙锁,两个事务相互等待,死锁产生。
那么咱们此时就能大概明白最初那个Mybatis-plus的saveOrUpdate方法为什么会造成间隙锁死锁的问题,也就是线上存在两个并发事务,然后更新的时候都没有更新到,此时都在自己的间隙加了间隙锁,然后再到彼此的区间进行数据插入,此时就会造成两个事务互相等待对方的释放间隙锁,从而导致死锁。也许有同学会想,线上的数据几乎不可能刚好会存在1-5,6-9这种间隙,来给并发事务各自加锁,又刚好到彼此区间插入数据的场景,所以就会有接下来验证间隙锁加锁是非互斥的,再一次深度还原间隙锁死锁的场景。

5.2 验证间隙锁加锁非互斥

5.2.1 依然以t_gap_lock为例

  1. mysql> select * from t_gap_lock;
  2. +----+--------+------+
  3. | id | name | age |
  4. +----+--------+------+
  5. | 1 | 张一 | 21 |
  6. | 5 | 李五 | 25 |
  7. | 6 | 赵六 | 26 |
  8. | 9 | 王九 | 29 |
  9. | 12 | 十二 | 12 |
  10. +----+--------+------+

5.2.2 操作

1、此时咱们开启事务一,然后执行更新id=13的数据,按照咱们的理论,id=13这个数据不存在,说明它会在13-正无穷(因为当前索引树上没有比13更大的值)之间加间隙锁。

  1. #开启事务一
  2. begin;
  3. #事务一在13-正无穷添加间隙锁
  4. update t_gap_lock t set t.age = 13 where t.id = 13;

2、然后开启事务二,然后也执行更新id=13的数据,按照咱们的理论,事务二也会对13-正无穷之间加间隙锁

  1. #开启事务二
  2. begin;
  3. #在13-正无穷添加间隙锁
  4. update t_gap_lock t set t.age = 13 where t.id = 13;

3、那么重点来了,此时需要做的操作就是让事务一在13-正无穷之间插入数据,会发现此时事务已经被阻塞,无法执行insert,因为事务二已经对该区间加了间隙锁。

  1. #事务一在13-正无穷中新增数据
  2. insert into t_gap_lock(id, name, age) values (13,'十六',16);

4、在事务一等待锁的同时,咱们让事务二同时在13-正无穷之间插入数据,这个时候会发现,只要事务二一执行插入。MySQL立即报了死锁,就会见到如下提示:

[40001][1213] Deadlock found when trying to get lock; try restarting transaction。

  1. #事务二在13-正无穷中新增数据
  2. insert into t_gap_lock(id, name, age) values (13,'十六',16);

5、因为咱们已经用1-5以及6-9这种明显的间隙还原了间隙锁死锁,所以13-正无穷发生间隙锁死锁的原理与其无异,这里有个非常大的区别就是事务一已经在13-正无穷加了间隙锁,事务二依然可以对此间隙加间隙锁,所以用实际证明了间隙锁加锁是非互斥的。此时咱们回忆一下Mybatis-plus的saveOrUpdate方法,发现线上只要出现两个并发事务去修改同一条不存在的数据,就会立马出现间隙锁死锁。

5.3 验证当修改数据存在时,间隙锁只会锁住当前行

还有一个比较重要的点就是,当修改的数据存在时,MySQL只会锁住当前行,咱们一起来分析下整个过程。

5.3.1 依然以t_gap_lock为例

  1. mysql> select * from t_gap_lock;
  2. +----+--------+------+
  3. | id | name | age |
  4. +----+--------+------+
  5. | 1 | 张一 | 21 |
  6. | 5 | 李五 | 25 |
  7. | 6 | 赵六 | 26 |
  8. | 9 | 王九 | 29 |
  9. | 12 | 十二 | 12 |
  10. +----+--------+------+

5.3.2 操作

1、此时开启事务一,然后执行更新id=12的数据,按照咱们的理论,id=12这个数据存在,说明MySQL只会锁定id=12这一行数据。

  1. #开启事务一
  2. begin;
  3. #事务一只在12上加间隙锁
  4. update t_gap_lock t set t.age = 12 where t.id = 12;

2、然后开启事务二,然后执行更新id=13的数据,按照咱们的理论,id=13这个数据不存在,说明它会在13-正无穷(因为当前索引树上没有比13更大的值)之间加间隙锁

  1. #开启事务二
  2. begin;
  3. #事务二在13-正无穷添加间隙锁
  4. update t_gap_lock t set t.age = 13 where t.id = 13;

3、那么重点来了,此时需要做的操作就是让事务一在13-正无穷之间插入数据,会发现此时事务已经被阻塞,无法执行insert,因为事务二已经对该区间加了间隙锁。

  1. #事务一在13-正无穷中新增数据
  2. insert into t_gap_lock(id, name, age) values (15,'十五',15);

4、在事务一等待锁的同时,咱们让事务二在12-正无穷之间插入数据,这个时候会发现,事务二能够正常插入,说明事务二没有被间隙锁阻塞,待事务二提交或回滚后,事务一也正常提交。

  1. #事务二在13-正无穷中新增数据
  2. insert into t_gap_lock(id, name, age) values (13,'十六',16);

5、通过以上验证,MySQL在更新id=12,即数据存在时,并没有对12-正无穷添加间隙锁,而是只锁定了id=12这一行数据,从而降低锁的颗粒度以提高性能。