1、概述
锁是计算机协调多个线程或者进程并发访问某一资源的机制。在程序开发中会存在多线程同步的问题,当多个线程并发访问某个数据的时候,尤其是针对一些敏感数据的时候(比如订单、金额),我们 就需要保证这个数据在任何时刻最多只有一个线程访问,保证数据的完整性和一致性。在开发过程中加锁是为了保证数据的一致性,这个思想在数据库领域中同样也很重要。
在数据库中,除传统的计算资源(如CPU、RAM、I/O等)的争用以外,数据也是一种供许多用户共享的资源。为保证数据的一致性,需要对并发操作进行控制 ,因此产生了锁。同时 锁机制也为实现MySQL的各个隔离级别提供了保证。 锁冲突也是影响数据库 并发访问性能 的一个重要因素。所以锁对数据库而言显得尤其重要,也更加复杂。
2、MySQL并发事务访问相同记录
2.1 读-读情况
读-读 情况,即并发事务相继 读取相同的记录 。读取操作本身不会对记录有任何影响,并不会引起什么问题,所以允许这种情况的发生。
2.2 写-写情况
写-写 情况,即并发事务相继对相同的记录做出改动。
在这种情况下会发生 脏写 的问题,任何一种隔离级别都不允许这种问题的发生。
所以在多个未提交事务相继对一条记录做改动时,需要让它们排队执行 ,这个排队的过程其实是通过 锁 来实现的。
这个所谓的锁其实是一个 内存中的结构,在事务执行前本来是没有锁的,也就是说一开始是没有锁结构和记录进行关联的,如图所示:
当一个事务想对这条记录做改动时,首先会看看内存中有没有与这条记录关联的锁结构,当没有的时候就会在内存中生成一个锁结构与之关联。比如,事务 T1 要对这条记录做改动,就需要生成一个锁结构与之关联:


小结几种说法:
- 不加锁意思就是不需要在内存种生成对应的锁结构,可以直接执行操作。
- 获取锁成功,或者加锁成功意思就是在内存中生成了对应的锁结构,而锁结构的is_waiting属性为false,也就是事务可以继续执行操作。
获取锁失败,或者加锁失败,或者没有获取到锁意思就是在内存中生成了对应的锁结构,不郭锁结构的is_waiting属性为true,也就是事务需要等待,不可以继续执行操作。
2.3 读-写或写-读情况
读-写或 写-读,即一个事务进行读取操作,另一个进行改动操作。这种情况下可能发生 脏读 、 不可重复读 、 幻读 的问题
各个数据库厂商对 SQL标准 的支持都可能不一样。比如MySQL在 REPEATABLE READ 隔离级别上就已经解决了 幻读问题2.4 并发问题的解决方案
怎么解决 脏读 、 不可重复读 、 幻读 这些问题呢?其实有两种可选的解决方案:
方案一:读操作利用多版本并发控制( MVCC ,下章讲解),写操作进行 加锁 。
所谓的MVCC,就是一个ReadView,通过ReadView找到符合条件的记录版本(历史版本由undo日志构建)。查询语句只能读到在生成ReadView之前已提交事务所做的更改,在生成ReadView之前未提交的事务或者之后才开启的事务所做的更改时看不到的。而写操作肯定针对得到时最新版本的记录,读记录的历史版本和改动记录的最新版本本身并不冲突,也就是采用MVCC时,读-写操作不冲突。
普通的select语句在READ COMMITED和REPEATABLE READ隔离级别下会使用到MVCC读取记录。
- 在READ COMMITTED隔离级别下,一个事务在执行过程中每次执行SELECT操作时都会生成一个ReadView,ReadView的存在本身就保证了事务不可以读取到未提交的事务所做的更改,也就是避免了脏读现象;
- 在REPEATABLE READ隔离级别下,一个事务在执行过程中只有第一次执行SELECT操作,才会生成一个ReadView,之后的SELECT操作都复用这个ReadView,这样也就避免了不可重复读和幻读的问题。
- 方案二:读、写操作都采用加锁的方式
如果我们的一些业务场景不允许读取记录的旧版本,而是每次都必须去读取记录的最新版本。
比如,在银行存款的事务中,你需要先把账户余额读出来,然后将其加上本次存款的数额,然后再写到数据库中。在将账户余额读取出来后,就不想让别的事务再访问该余额,直到本次存款事务操作完成,其他事务才可以访问账户的余额。
这样在读取记录的时候就需要对其进行加锁操作,这样也就意味着读操作和写操作也像写-写那样排队执行。
- 小结对比:
- 采用MVCC方式的话,读-写操作彼此并不冲突, 性能更高。
- 采用 加锁 方式的话,读-写操作彼此需要 排队执行,影响性能。
一般情况下我们当然愿意采用MVCC来解决读-写操作并发执行的问题,但是业务在某些特殊情况下,要求必须采用加锁的方式执行。下面就讲解下Mysql中不同类别的锁。
3、锁的不同角度分类
3.1 从数据操作的类型划分:读锁、写锁
对于数据库中并发事务的读-读情况并不会引起什么问题。
对于写-写、写-读|读-写这些情况可能会引起一些问题,需要使用MVCC或者加锁的方式来解决它们。
在使用加锁的方式来解决问题时,由于既要允许读-读情况不受影响,又要使写-写,读-写|写-读情况中的操作相互阻塞,所以MySQL实现一个由两种类型的锁组成的锁系统来解决。这两种类型的锁通常被称为共享锁(Shared Lock,S Lock),和排它锁(Exclusive Lock,X Lock),也叫读锁(read lock)和写锁(write lock)。
- 读锁:也称为 共享锁、英文用 S 表示。针对同一份数据,多个事务的读操作可以同时进行而不会互相影响,相互不阻塞的。
- 写锁:也称为 排他锁 、英文用 X 表示。==当前写操作没有完成前,它会阻断其他写锁和读锁。这样就能确保在给定的时间里,只有一个事务能执行写入,并防止其他用户读取正在写入的同一资源==。
需要注意的是对于 InnoDB 引擎来说,读锁和写锁可以加在表上,也可以加在行上。
举例(行级读写锁):如果一个事务T1已经获得了某个行r的读锁,那么此时另外的一个事务T2是可以去获取这个行r的读锁的,因为读取操作并没有改变行r的数据;但是,如果某个事务T3想获得行r的写锁,则它必须等待事务T1,T2释放掉行r上的读锁才行。
总结:这里的兼容是指对同一张表或记录的锁的兼容性情况。
| 写锁 | 读锁 | |
|---|---|---|
| 写锁 | 不兼容 | 不兼容 |
| 读锁 | 不兼容 | 兼容 |
1、锁定读
在采用加锁方式 解决脏读、不可重复读、幻读这些问题时。读取一条记录时需要获取记录的S锁,其实是不严谨的,有时候需要在读取记录时就获取记录的写锁,来禁止别的事务读写该记录,为此MySQL提出两种比较特殊的SELECT语句。
- 对读取的记录加上读锁select …. lock in share mode;
#
select … for share; #(8.0新写法)在普通select语句后边加lock in share mode,如果当前事务执行了该语句,那么它会为读取到的记录加S锁,这样允许别的事务继续获取这些记录的读锁。(比方说别的事务也使用select … lock in share mode语句来读取这些记录),但是不能获取这些记录的写锁(比如使用select … for update语句来读取这些记录,或者直接修改这些记录)。如果别的事务想要获取这些记录的写锁,那么它们会阻塞,直到当前事务提交后将这些记录上的读锁释放掉。 - 对读取记录加写锁select … for update;在普通select语句后边加for update,如果当前事务执行了该语句,那么它会为读取到的记录加上写锁,这样及不允许别的事务获取这些记录读锁(比方说别的事务也使用select … lock in share mode语句来读取这些记录),也不允许获取这些记录的写锁。(比如使用select … for update语句来读取这些记录,或者直接修改这些记录)如果别的事务想要获取这些记录的读锁或者写锁,那么它们会阻塞,直到当前事务提交之后将这些记录上的写锁释放掉。
MySQL8.0新特性:
在5.7以及之前的版本,select …. for update,如果获取不到锁,会一直等待,直到innodb_lock_wait_timeout超时。在8.0版本中,select … for update,select …for share添加nowait、skip locked语法,跳过锁等待,或者跳过锁定。
- 通过添加nowait、skip locked语法,能够立即返回。如果查询的行已经加锁:
- 那么nowait会立即报错返回
- 而skip locked也会立即返回,只是返回的结果不包含被锁定的行。
2、写操作
平常所用到的写操作无非时 update 、delete、insert这三种:
- delete:对一行记录坐delete操作的过程其实是先在B+树中定位到这条记录的位置,然后获取这条记录的写锁,再执行delete mark操作,我们也可以吧这个定位待删除记录在B+树中位置的过程看成是一个获取写锁的锁定读
- update:对一条记录做update操作时分为三种情况:情况1:未修改该记录的键值,并且被更新的列占用的存储空间在修改前后未发生变化。则先在B+树中定位到这条记录的位置,然后再获取一下记录的写锁,最后在原记录的位置进行修改操作。我们也可以把这个定位待修改记录在B+树中位置的过程看称一个获取读锁的锁定读情况2:未修改该记录的键值,并且至少有一个被更新的列占用的存储空间在修改前后发生变化。则先在B+树中定位到这条记录的位置,然后再获取一下记录的写锁,将该记录彻底删除掉(就是把记录彻底移入垃圾链表),最后再插入一条新记录。这个定位待修改记录再B+树中位置的过程就可以看成一个获取读锁的锁定读,新插入的记录由insert操作提供的隐式锁进行保护。情况3:修改该记录的键值,则相当于再原记录上做delete操作之后再来一次insert操作,加锁操作就需要按照delete和insert的规则进行了。
insert:一般情况下,新插入一条记录的操作并不加锁,通过一种称之为隐式锁的结构来保护这条新插入的记录再本事务提交前不被别的事务访问。
3.2 从数据操作的粒度划分:表级锁、页级锁、行锁
为了尽可能的提高数据库的并发度,每次锁定的数据范围越小越好,理论上每次只锁定当前操作的数据的方案会得到最大的并发度,但是管理锁是很耗资源的事情(涉及获取,检查,释放锁等动作)。因此数据库操作需要在并发响应和系统性能两方面进行平衡,这样就产生了锁粒度(Lock granularity)的概念。
对一条记录加锁影响的也只是这条记录而已,我们就说这个锁的粒度比较细;其实一个事务也可以在表级别进行加锁,自然就被称之为表级锁或表锁,对一个表加锁影响整个表里面的记录,我们就说这个锁的粒度比较粗。锁的粒度主要分为表级锁、页级锁和行锁1、表锁(Table Lock)
该锁会锁定整张表,它是Mysql中最基本的锁策略,并不依赖存储引擎(不管你是Mysql什么存储引擎对于表锁的策略都是一样的),并且表锁是开销最小的策略(因为粒度比较大)。由于表级锁一次会将整张表锁定,所以可以很好的避免死锁问题。当然,锁的粒度大所带来的负面影响就是出现锁资源争用的概率也会最高,导致并发率大打折扣
表级别的读锁、写锁
在对某个表执行SELECT、INSERT、DELETE、UPDATE语句时,InnoDB存储引擎是不会为这个表添加表级别的 S锁 或者 X锁的。
在对某个表执行一些诸如 ALTER TABLE 、 DROP TABLE 这类的 DDL 语句时,其他事务对这个表并发执行诸如SELECT、INSERT、DELETE、UPDATE的语句会发生阻塞。同理,某个事务中对某个表执行SELECT、INSERT、DELETE、UPDATE语句时,在其他会话中对这个表执行 DDL 语句也会发生阻塞。
这个过程其实是通过在 server层 使用一种称之为 元数据锁(英文名: Metadata Locks ,简称 MDL)结构来实现的。
一般情况下,不会使用InnoDB存储引擎提供的表级别的 S锁 和X锁 。只会在一些特殊情况下,比方说 崩溃恢复过程中用到。
比如,在系统变量 autocommit=0,innodb_table_locks = 1时, 手动获取InnoDB存储引擎提供的表t 的 S锁或者X锁 可以这么写:
1.LOCK TABLES t READ :InnoDB存储引擎会对表 t 加表级别的S锁
2.LOCK TABLES t WRITE :InnoDB存储引擎会对表 t 加表级别的X锁。
不过尽量避免在使用InnoDB存储引擎的表上使用 LOCK TABLES 这样的手动锁表语句,它们并不会提供什么额外的保护,只是会降低并发能力而已。InnoDB的厉害之处还是实现了更细粒度的 行锁 ,关于InnoDB表级别的 S锁 和 X锁 大家了解一下就可以了。
总结:
MyISAM在执行查询语句(SELECT)前,会给涉及的所有表加读锁,在执行增删改操作前,会给涉及的表加写锁,InnoDB存储引擎是不会为这个表添加 表级的读写锁的。
MySQL的表级锁有两种模式:(以MyISAM表进行操作的演示)
1.表共享读锁(Table Read Lock)
2.表独占写锁(Table Write Lock)
| 锁类型 | 自己可读 | 自己可写 | 自己可操作其他表 | 他人可读 | 他人可写 |
|---|---|---|---|---|---|
| 读锁 | 是 | 否 | 否 | 是 | 否,等 |
| 写锁 | 是 | 是 | 否 | 否,等 | 否等 |
- 意向锁(intention lock)
InnoDB支持 多粒度锁(multiple granularity locking),,它允许 行级锁 与 表级锁共存,而意向锁就是其中的一种 表锁
1、意向锁的存在是为了协调行锁和表锁的关系,支持多粒度(表锁和行锁)的锁共存
2、意向锁是一种不与行级锁冲突的表级锁,这一点非常重要
3、表明“某个事务正在某些行持有了锁或该事务准备去持有锁”
意向锁分两种:
- ==意向共享锁==(intention shared lock, IS):事务有意向对表中的某些行加共享锁(S锁)
— 事务要获取某些行的 S 锁,必须先获得表的 IS 锁。
SELECT column FROM table … LOCK IN SHARE MODE;
- ==意向排他锁==(intention exclusive lock, IX):事务有意向对表中的某些行加排他锁(X锁)
— 事务要获取某些行的 X 锁,必须先获得表的 IX 锁。
SELECT column FROM table … FOR UPDATE;
即:意向锁是由存储引擎 自己维护的 ,用户无法手动操作意向锁,在为数据行加共享 / 排他锁之前,InooDB 会先获取该数据行 所在数据表的对应意向锁 。
1.意向锁要解决的问题
现在有两个事务,分别是T1和T2,其中T2试图在该表级别上应用共享锁或排它锁,如果没有意向锁存在,那么T2就要去检查各个页或行是否存在锁;
如果存在意向锁,那么此时就会受到T1控制的表级别意向锁的阻塞。T2在锁定该表前不必检查各个页或者行锁,而只需要检查表上的意向锁。简单来说就是给更大一级别的空间示意里面是否已经上过锁。
在数据表的场景中,==如果我们给某一行数据上了排它锁,数据库会自动给更大一级的空间,比如数据页或数据表加上意向锁,告诉其他人这个数据页或数据表已经有人上过排它锁了==,这样当其他人想要获取数据表排它锁的时候,只需要了解 是否有人已经获取了这个数据表的意向排它锁即可。
- 如果事务想要获得数据表中某些记录的共享锁,就需要在数据表上添加意向共享锁
- 如果事务想要获取数据表中某些记录的排它锁,就需要在数据表上添加意向排它锁
这时,意向锁会告诉其他事务已经有人锁定了表中的某些记录。
意向锁的并发性
意向锁不会与行级的共享 / 排他锁互斥!正因为如此,意向锁并不会影响到多个事务对不同数据行加排他锁时的并发性。(不然我们直接用普通的表锁就行了)
我们扩展一下上面 teacher表的例子来概括一下意向锁的作用(一条数据从被锁定到被释放的过程中,可能存在多种不同锁,但是这里我们只着重表现意向锁)。
从上面的案例可以得到如下结论:
- InnoDB 支持 多粒度锁 ,特定场景下,行级锁可以与表级锁共
- 意向锁之间互不排斥,但除了 IS 与 S 兼容外, 意向锁会与 共享锁 / 排他锁 互斥
- IX,IS是表级锁,不会和行级的X,S锁发生冲突。只会和表级的X,S发生冲突。
- 意向锁在保证并发性的前提下,实现了行锁和表锁共存 且 满足事务隔离性 的要求。
- 自增锁(AUTO-INC锁)
在使用Mysql过程中,我们可以为表的某个列添加AUTO_INCREMENT属性。例如
CREATE TABLE teacher (id int NOT NULL AUTO_INCREMENT,name varchar(255) NOT NULL,
PRIMARY KEY (id)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;
由于这个表的id字段声明了AUTO_INCREMENT,意味着在书写插入语句时不需要为其赋值,SQL语句修改如下所示。
INSERT INTO teacher (name) VALUES (‘zhangsan’), (‘lisi’);
上边的插入语句并没有为id列显式赋值,所以系统会自动为它赋上递增的值
现在我们看到的上面插入数据只是一种简单的插入模式,所有插入数据的方式总共分为三类,分别是
Simple inserts(简单插入)、Bulk inserts(批量插入)、Mixed-mode inserts(混合模式插入)
Simple inserts(简单插入):
可以 预先确定要插入的行数 (当语句被初始处理时)的语句。包括没有嵌套子查询的单行和多行INSERT…VALUES() 和 REPLACE 语句。比如我们上面举的例子就属于该类插入,已经确定要插入的行数。
Bulk inserts(批量插入):
事先不知道要插入的行数(和所需自动递增值的数量)的语句。比如INSERT … SELECT, REPLACE… SELECT 和 LOAD DATA语句,但不包括纯INSERT。 InnoDB在每处理一行,为AUTO_INCREMENT列分配一个新值
Mixed-mode inserts(混合模式插入):
这些是“Simple inserts”语句但是指定部分新行的自动递增值。
例如 INSERT INTO teacher (id,name)VALUES (1,’a’), (NULL,’b’), (5,’c’), (NULL,’d’);
只是指定了部分id的值。另一种类型的“混合模式插入”是 INSERT … ON DUPLICATE KEY UPDATE
- 元数据锁(MDL锁)
MySQL5.5引入了meta data lock,简称MDL锁,属于表锁范畴MDL 的作用是,保证读写的正确性。比如,如果一个查询正在遍历一个表中的数据,而执行期间另一个线程对这个 表结构做变更,增加了一列,那么查询线程拿到的结果跟表结构对不上,肯定是不行的。
因此,当对一个表做增删改查操作的时候,加 MDL读锁;当要对表做结构变更操作的时候,加 MDL 写锁
2、InnoDB的行锁
行锁(Row Lock)也称为记录锁,顾名思义,就是锁住某一行(某条记录row)。需要的注意是,Mysql服务器并没有实现行锁机制,行级锁只在存储引擎层实现。
优点:锁定粒度小,发送锁冲突概率低,可以实现的并发度高
缺点:对于锁的开销比较大,加锁会比较慢,容易出现死锁情况。
InnoDB与MyISAM的最大不同有两点:一支持事务;二是采用了行级锁
- 记录锁(Record Locks)
记录锁也就是仅仅把一条记录锁上,官方的类型名称为:Lock_REC_Not_GAP。
比如我们把id值为8的那条记录加一个记录锁的示意图如图所示。仅仅是锁住了id值为8的记录,对周围的数据没有影响
举例:
记录锁时有S锁和X锁之分的,称之为 S型记录锁 和 X型记录锁 。
当一个事务获取了一条记录的S型记录锁后,其他事务也可以继续获取该记录的S型记录锁,但不可以继续获取X型记录锁
当一个事务获取了一条记录的X型记录锁后,其他事务既不可以继续获取该记录的S型记录锁,也不可以继续获取X型记录锁
- 间隙锁(Gap_Lock)
Mysql在可重复读的隔离级别下是可以解决幻读问题的,解决方案有两种,可以使用MVCC(一致性非锁定读),也可以采用加锁方案解决。但是在使用加锁方案解决的时候有个大问题,就是事务在第一次执行读取操作时,那些幻影记录尚不存在,我们无法给这些 幻影记录 加上 记录锁。
InnoDB提出了一种称之为Gap Locks的锁,官方的类型名称为:LOCK_GAP,我们可以简称为gap锁 。比如,把id值为8的那条记录加一个gap锁的示意图如下
图中id值为8的记录加了gap锁,意味着不允许别的事务在id值为8的记录前边的间隙插入新记录,其实就是id列的值(3, 8)这个区间的新记录是不允许立即插入的。
比如,有另外一个事务再想插入一条id值为4的新记录,它定位到该条新记录的下一条记录的id值为8,而这条记录上又有一个gap锁,所以就会阻塞插入操作,直到拥有这个gap锁的事务提交了之后,id列的值在区间(3, 8)中的新记录才可以被插入
==gap锁的提出仅仅是为了防止插入幻影记录而提出的==,虽然有共享gap锁和独占gap锁的说法,但是它们起到的作用是相同的。而且如果对一条记录加了gap锁(无论是共享gap还是独占gap锁),并不会限制其他事务对这条记录加记录锁或者继续加gap锁。
- 临键锁(Next -Keys Locks)
有时候我们既想锁住某条记录 ,又想 阻止 其他事务在该记录前边的 间隙插入新记录 ,所以InnoDB就提出了一种称之为 Next-Key Locks 的锁,官方的类型名称为: LOCK_ORDINARY ,我们也可以简称为next-key锁 。Next-Key Locks是在存储引擎 innodb 、事务级别在 可重复读 的情况下使用的数据库锁,innodb默认的锁就是Next-Key locks
next-key锁的本质就是一个记录锁和间隙锁的组合体,它既能保护好该条记录,又能阻止别的事务将新记录插入被保护记录前边的间隙
begin;
select * from student where id <=8 and id > 3 for update;
- 插入意向锁(Insert Intention Locks)
我们说一个事务在插入一条记录时需要判断一下插入位置 是不是被别的事务加了gap锁( next-key锁也包含 gap锁 )
如果有的话,插入操作需要等待,直到拥有 gap锁 的那个事务提交。但是InnoDB规定事务在等待的时候也需要在内存中生成一个锁结构,表明有事务想在某个 间隙 中 插入 新记录,
但是现在在等待。InnoDB就把这种类型的锁命名为 Insert Intention Locks ,官方的类型名称为LOCK_INSERT_INTENTION ,我们称为 插入意向锁 。插入意向锁是一种 Gap锁 ,不是意向锁,在insert操作时产生
插入意向锁是在插入一条记录行前,由 INSERT 操作产生的一种间隙锁
==事实上插入意向锁并不会阻止别的事务继续获取该记录上任何类型的锁。==
3、页锁
页锁就是在 页的粒度上进行锁定,锁定的数据资源比行锁要多,因为一个页中可以有多个行记录。当我们使用页锁的时候,会出现数据浪费的现象,但这样的浪费最多也就是一个页上的数据行。==页锁的开销介于表锁和行锁之间,会出现死锁。锁定粒度介于表锁和行锁之间,并发度一般==
每个层级的锁数量是有限制的,因为锁会占用内存空间, 锁空间的大小是有限的 。当某个层级的锁数量超过了这个层级的阈值时,就会进行 锁升级。锁升级就是用更大粒度的锁替代多个更小粒度的锁,比如InnoDB 中行锁升级为表锁,这样做的好处是占用的锁空间降低了,但同时数据的并发度也下降了。
3.3 从对待锁的态度上来划分:乐观锁、悲观锁
从对待锁的态度上看锁的话,可以将锁分成乐观锁和悲观锁,从名字中也可以看出这两种锁是==两种看待数据并发的思维方式==。需要注意的是,乐观锁和悲观锁并不是锁,而是锁的 设计思想 。
1、悲观锁(Pessimistic Locking)
悲观锁总是假设最坏的情况,每次去拿数据的时候都认为别人会修改,所以每次在拿数据的时候都会上锁,这样别人想拿这个数据就会阻塞,直到它拿到锁==(共享资源每次只能给一个线程使用,其他线程阻塞,用完后再把资源转给其他线程)==。比如行锁、表锁等、读锁、写锁等,都时在操作之前先上锁,当其他线程想要访问数据的时候,都需要阻塞挂起。Java中的synchronized、ReetrantLock等独占锁都是悲观锁的思想实现。
秒杀案例1:
商品秒杀过程中,库存数量的减少,避免出现超卖的情况,比如,商品表里面有一个字段为quantity表示当前该商品的库存量。假设商品为华为mate40,id为1001,quantity=100个,如果不使用锁的情况下,操作方法如下
#1、查出商品库存
select quantity from items where id = 1001;
#2、如果库存大于0,则根据商品信息生成订单
insert into orders(item_id) values(1001);
#3、修改商品的库存,num表示购买数量
update items set quantity = quantity - num where id = 1001;
这样写的话,在并发量小的公司没有大的问题,但是如果在高并发环境下可能出现以下问题
其中线程B此时已经下单并且减完库存,这个时候去线程A,依然去执行了step3,就造成了超卖。
我们使用的时悲观锁就可以解决这个问题,商品信息从查询出来到修改,中间有一个生成订单的过程,使用悲观锁的原理就是,当我们在查询items信息后,就把当前的数据锁定,直到我们修改完毕后再解锁。那么整个过程中,因为数据被锁定了,就不会出现有第三者来对其修改了。==而这样做的前提是需要将执行的sql语句放在同一个事务中,否则达不到锁定数据行的目的。==
修改如下:
#1、查出商品库存
select quantity from items where id = 1001 for update;
#2、如果库存大于0,则根据商品信息生成订单
insert into orders(item_id) values(1001);
#3、修改商品的库存,num表示购买数量
update items set quantity = quantity - num where id = 1001;
select … for update 是Mysql中悲观锁。此时在items表中,id为1001的那条数据就被我们锁定了,其他的要执行select quantity from items where id = 1001 for update;语句的事务必须等本次事务提交之后才能执行。这样我们可以保证当前的数据不会被其他事务修改。
注意,当执行select quantity from items where id = 1001 for update;语句之后,如果其他事务中执行select quantity from items where id = 1001;语句并不会受影响,仍然可以正常查出数据。
==注意:select … for update 语句执行过程中所有扫描的行都会被锁上,因此在Mysql中用悲观锁必须确定使用了索引,而不是全表扫描,否则将会把整个表锁住。==
悲观锁不适合用的场景较多,它存在一些不足,因为悲观锁大多数情况下依靠数据库的锁机制来实现,以保证程序的并发访问性,同时这样对数据库性能开销影响也很大,特别是长事务而言,这样的开销往往无法承受,这时就需要乐观锁。
2、乐观锁(Optimistic Locking)
乐观锁认为对同一数据的并发操作不会总发生,属于小概率事件,不用每次都对数据上锁,但是在更新的时候会判断一下在此期间别人有没有去更新这个数据,
也就是不采用数据库自身的锁机制,而是通过程序来实现。
在程序上,我们可以采用 版本号机制或者 CAS机制 实现。==乐观锁适用于多读的应用类型,这样可以提高吞吐量==。在Java中 java.util.concurrent.atomic 包下的原子变量类就是使用了乐观锁的一种实现方式:CAS实现的。
1、乐观锁的版本号机制
在表中设计一个 版本字段 version ,第一次读的时候,会获取 version 字段的取值。然后对数据进行更新或删除操作时,会执行UPDATE … SET version=version+1 WHERE version=version 。此时如果已经有事务对这条数据进行了更改,修改就不会成功。
这种方式类似我们熟悉的SVN、CVS版本管理系统,当我们修改了代码进行提交时,首先会检查当前版本号与服务器上的版本号是否一致,如果一致就可以直接提交,如果不一致就需要更新服务器上的最新代码,然后再进行提交。
2、乐观锁的时间戳机制
时间戳和版本号机制一样,也是在更新提交的时候,将当前数据的时间戳和更新之前取得的时间戳进行比较,如果两者一致则更新成功,否则就是版本冲突。
你能看到乐观锁就是程序员自己控制数据并发操作的权限,基本是通过给数据行增加一个戳(版本号或者时间戳),从而证明当前拿到的数据是否最新
秒杀案例2:
依然使用上面秒杀的案例,执行流程如下:
#1、查出商品库存
select quantity from items where id = 1001 for update;
#2、如果库存大于0,则根据商品信息生成订单
insert into orders(item_id) values(1001);
#3、修改商品的库存,num表示购买数量
update items set quantity = quantity - num,version = version+1 where id = 1001 and version = #{version};
注意,如果数据表是读写分离的表,当master表中写入的数据没有及时同步到slave表中时,会造成更新一直失败的问题。此时需要强制读取master表中的数据(即将select语句放到事务中即可,这时候查询的就是master主库了)。
如果我们对同一条数据进行频繁的修改的话,那么就会出现这样的一种场景,每次修改都只有一个事务更新成功,在业务感知上面就有大量的失败操作。我们把代码修改如下:
#1、查出商品库存
select quantity from items where id = 1001 for update;
#2、如果库存大于0,则根据商品信息生成订单
insert into orders(item_id) values(1001);
#3、修改商品的库存,num表示购买数量
update items set quantity = quantity - num where id = 1001 and quantity - num > 0;
这样每次都会修改成功,而且不会出现超卖的情况。但是大流量打入mysql,容易使得mysql宕机。
3、两种锁的适用场景
从这两种锁的设计思想中,我们总结一下乐观锁和悲观锁的适用场景:
1、乐观锁适合于读操作多的场景,相对来说写操作比较少。它的优点在于 程序实现, 不存在死锁问题,不过适用场景也会相对乐观,因为它阻止不了除了程序以外的数据库操作。
2、悲观锁 适合 写操作多 的场景,因为写的操作具有 排它性 。采用悲观锁的方式,可以在数据库层面阻止其他事务对该数据的操作权限,防止 读 - 写和 写 - 写 的冲突
3.4 按加锁的方式划分:显示锁、隐式锁
1、隐式锁
一个事务在执行insert操作时,如果即将插入的间隙已经被其他事务加了gap锁,那么本次insert操作会阻塞,并且当前事务会在该间隙上加一个插入意向锁,否则一般情况下insert操作是不加锁的。那如果一个事务首先插入了一条记录(此时并没有在内存生产与该记录相关联的锁结构),然后另一个事务:
- 立即使用select … Lock IN share mode语句读取这条记录,也就是要获取到这条记录的S锁,或者使用select … for update语句来读取这条记录,也就要获取这条记录的X锁,怎么办?如果允许这种情况发送,那么可能产生脏读问题。
- 立即修改这条记录,也就是要获取这条记录的X锁,怎么办?如果允许这种情况发生,那么可能产生脏写问题。
这个时候我们前边提过的事务id又要起作用了,我们把聚簇索引和二级索引中的记录分开看以下:
- 情景一:对于聚簇索引记录来说,有一个 trx_id 隐藏列,该隐藏列记录着最后改动该记录的 事务id 。那么如果在当前事务中新插入一条聚簇索引记录后,该记录的 trx_id隐藏列代表的的就是当前事务的 事务id ,如果其他事务此时想对该记录添加 S锁 或者 X锁 时,首先会看一下该记录的trx_id隐藏列代表的事务是否是当前的活跃事务,如果是的话,那么就帮助当前事务创建一个 X锁 (也就是为当前事务创建一个锁结构, is_waiting属性是 false ),然后自己进入等待状态(也就是为自己也创建一个锁结构, is_waiting 属性是 true )。
- 情景二:对于二级索引记录来说,本身并没有 trx_id 隐藏列,但是在二级索引页面的 PageHeader 部分有一个 PAGE_MAX_TRX_ID 属性,该属性代表对该页面做改动的最大的事务id ,如果 PAGE_MAX_TRX_ID 属性值小于当前最小的活跃 事务id ,那么说明对该页面做修改的事务都已经提交了,否则就需要在页面中定位到对应的二级索引记录,然后回表找到它对应的聚簇索引记录,然后再重复 情景一 的做法
即:一个事务对新插入的记录可以不显式的加锁(生成一个锁结构),但是由于事务id的存在,相当于加了一个隐式锁。别的事务在对这条记录加S锁或者X锁时,由于隐式锁的存在,会先帮助当前事务生成一个锁结构,然后自己再生成一个锁结构后进入等待状态。隐式锁是一种延迟加载的机制,从而来减少加锁的数量。
隐式锁再实际内存对象中并不含有这个锁信息。只有当产生锁等待的时候,隐式锁转化成显式锁。
InnoDB的insert操作,对插入的记录不加锁,但是此时如果有另外一个线程去进行当前读,session2会等待session1,这是如何实现的呢?
#session1
begin;
insert into student(id,name,class) values(12,”tom”,”一班”);
commit #后 即可查询
session2
select * from student lock in share mode;
#阻塞 因为session1里面事务没提交新增的数据会带有一把隐式锁
mysql> SELECT FROM performance_schema.data_lock_waits\G;
** 1. row *
ENGINE: INNODB
REQUESTING_ENGINE_LOCK_ID: 140562531358232:7:4:9:140562535668584
REQUESTING_ENGINE_TRANSACTION_ID: 422037508068888
REQUESTING_THREAD_ID: 64
REQUESTING_EVENT_ID: 6
REQUESTING_OBJECT_INSTANCE_BEGIN: 140562535668584
BLOCKING_ENGINE_LOCK_ID: 140562531351768:7:4:9:140562535619104
BLOCKING_ENGINE_TRANSACTION_ID: 15902
BLOCKING_THREAD_ID: 64
BLOCKING_EVENT_ID: 6
BLOCKING_OBJECT_INSTANCE_BEGIN: 140562535619104
1 row in set (0.00 sec)
隐式锁的逻辑过程如下:
- InnoDB的每条记录中都有一个隐含的trx_id字段,这个字段存在于聚集索引的B+Tree中。
- 再操作一条记录前,首先根据记录总的trx_id检查该事务是否是活动的事务(未提交或者回滚)。如果是活动的事务,首先将隐式锁转换为显式锁(就是为该事务添加一个锁)
- 检查是否有锁冲突,如果有,创建锁,并设置为waiting状态。如果没有冲突不加锁,跳到5
- 等待加锁成功,被唤醒,或者超时
- 写数据,并将自己的trx_id写入trx_id字段
2、显示锁
通过特定的语句进行加锁,我们一般称之为显示加锁,例如:
显示加共享锁:
select …. lock in share mode
显示加排它锁:
select …. for update
3.5 其他锁之:全局锁
全局锁就是对 整个数据库实例 加锁。当你需要让整个库处于 只读状态的时候,可以使用这个命令,之后其他线程的以下语句会被阻塞:数据更新语句(数据的增删改)、数据定义语句(包括建表、修改表结构等)和更新类事务的提交语句。全局锁的典型使用 场景 是:做 全库逻辑备份 。
全局锁的命令:
Flush tables with read lock
3.6其他锁之:死锁
1、概念
两个事务都持有对方需要的锁,并且在等待对方释放,并且双方都不会释放自己的锁。
举例1:
举例2:
用户A给B转账100,在此同时,用户B也给A转账100。这个过程,可能导致死锁。
# 事务1
update account set balance = balance -100 where name =’A’ #1
update account set balance = balance +100 where name =’B’ #3
事务2
update account set balance = balance -100 where name =’B’ #2
update account set balance = balance +100 where name =’A’ #4
2、产生死锁的必要条件
- 两个或者两个以上的事务
- 每个事务都已经持有锁并且申请新的锁
- 锁资源同时只能被同一个事务持有或者不兼容
- 事务之间因为持有锁和申请锁彼此循环等待
死锁的关键在于:两个或者两个以上的Session加锁的顺序不一致
3、如何处理死锁
方式1:等待,直到超时(innodb_lock_wait_timeout=60s)
即当两个事务互相等待时,当一个事务等待时间超过设置的阈值时,就将其回滚,d另外事务继续进行。这种说法简单有效,在innoDB中,参数innodb_lock_wait_timeout用来设置超时时间。
缺点:对于在线服务来说,这个等待时间往往时无法接受的。
那将此值修改短一些,比如1s,0.1s是否合适?
==不合适,容易误伤普通的锁等待。==
比如:事务A 修改了id=1的数据,事务2也去修改id=1的数据,那就造成排它锁等待,事务2等事务1提交后才能修改数据。
方式2:使用死锁检测进行死锁处理
方式1检测死锁太过被动,innodb还提供了wait-for graph算法来主动进行死锁检测,每当加锁请求无法立即满足需要等待并进入等待时,wait-for graph算法都会被触发。
这是一种较为主动的死锁检测机制,要求数据库保存锁的信息链表和事务等待链表两部分信息
基于这两个信息,可以绘制wait-for graph(等待图)
死锁检测的原理是构建一个以事务为顶点,锁为边的有向图,判断有向图是否存在环,存在即有死锁。
一旦检测到回路、有死锁,这时候InnoDB存储引擎会选择回滚undo量最小的事务,让其他事务继续执行(innodb_deadlock_detect=on 表示开启这个逻辑)
缺点:每个新的被阻塞的线程,都要判断是不是由于自己的加入导致了死锁,这个操作时间复杂度是O(n)。如果100个并发线程同时更新同一行,意味着要检测100100 = 1w次,1w个线程会检测1kw次。
*如何解决?
- 方式1:关闭死锁检测,但是意味着可能会出现大量超时,会导致业务有损
- 方式2:控制并发访问的数量。比如在中间件中实现对于相同行的更新,在进入引擎之前排队,这样在Innodb内部就不会有大量的死锁检测工作。
进一步思路:
可以考虑通过将一行改成逻辑上的多行来减少锁冲突。比如:连锁超市账户总额记录,可以考虑放到多条记录上。账户总额等于多个记录的值总和。
4、如何避免死锁
- 合理设计索引,使业务SQL尽可能的通过索引定位更少的行,减少锁竞争。
- 调整业务逻辑的SQL执行顺序,避免update/delete长时间持有锁的SQL在事务前面。
- 避免大事务,尽量将大事务拆成多个小事务来处理,小事务缩短锁定资源的时间,发生锁冲突的几率也更小
- 在并发比较高的系统中,不要显示加锁,特别是在事务里显式加锁。如:select … for update语句,如果在事务里允许了start transaction 或者设置了autocommit = 0,那么就会锁定锁查找到的记录。
降低隔离级别,如果业务允许,将隔离级别调低也是比较好的选择,比如将隔离级别从RR调整到RC,可以避免掉很多因为gap锁(间隙锁)造成的死锁。
4、锁的内部结构
我们前边说对一条记录加锁的本质就是在内存中创建一个锁结构与之关联,那么是不是一个事务对多条记录加锁,就要创建多个锁结构呢?比如:
#事务1
select * from user lock in share mode;
理论上创建多个锁结构没问题,但是如果一个事务要获取10000条记录的锁、生成10000个锁结构也太崩溃了!所以决定在对不同记录加锁时,如果符合下边这些条件的记录会放到一个锁结构中。在同一事务中进行加锁的操作
- 被加锁的记录在同一个页面中
- 加锁的类型是一样的
- 等待状态时一样的
Innodb存储引擎中的锁结构如下:
结构解析:
1.锁所在的事务信息 :
不论是 表锁 还是 行锁 ,都是在事务执行过程中生成的,哪个事务生成了这个 锁结构,这里就记录这个事务的信息
此 锁所在的事务信息 在内存结构中只是一个指针,通过指针可以找到内存中关于该事务的更多信息,比方说事务id等
2.索引信息:
对于 行锁 来说,需要记录一下加锁的记录是属于哪个索引的。这里也是一个指针。
3.表锁/行锁信息 :
表锁结构 和行锁结构在这个位置的内容是不同的:
- 表锁:记载着时对哪个表加的锁,还有其他的一些信息
- 行锁:记载了三个重要的信息:
- space ID:记录所在表空间
- page Number:记录所在页号
- n_bits:对于行锁来说,一条记录就对应着一个比特位,一个页面中包含很多记录,用不同的比特位来区分到底是哪一条记录加了锁。为此在行锁结构的末尾放置了一堆比特位,这个n_bits属性代表使用了多少比特位
n_bits的值一般都比页面中记录条数多一些。主要是为了之后在页面中插入了新记录后也不至于重新分配锁结构
4.type_mode:
这是一个32位的数,被分成了lock_mode、lock_type、rec_lock_type三部分,如图所示
- 锁的模式( lock_mode ),占用低4位,可选的值如下:在InnoDB存储引擎中,LOCK_IS,LOCK_IX,LOCK_AUTO_INC都算是表级锁的模式,LOCK_S和LOCK_X既可以算是表级锁的模式,也可以是行级锁的模式。
- LOCK_IS (十进制的 0 ):表示共享意向锁,也就是 IS锁 。
- LOCK_IX (十进制的 1 ):表示独占意向锁,也就是 IX锁 。
- LOCK_S (十进制的 2 ):表示共享锁,也就是 S锁
- LOCK_X (十进制的 3 ):表示独占锁,也就是 X锁 。
- LOCK_AUTO_INC (十进制的 4 ):表示 AUTO-INC锁 。
- 锁的类型( lock_type ),占用第5~8位,不过现阶段只有第5位和第6位被使用:
- LOCK_TABLE (十进制的 16 ),也就是当第5个比特位置为1时,表示表级锁
- LOCK_REC (十进制的 32 )也就是当第6个比特位置为1时,表示行
- 行锁的具体类型( rec_lock_type ),使用其余的位来表示。只有在 lock_type 的值为LOCK_REC 时,也就是只有在该锁为行级锁时,才会被细分为更多的类型:
- LOCK_ORDINARY (十进制的 0 ):表示 next-key锁 。
- LOCK_GAP (十进制的 512 ):也就是当第10个比特位置为1时,表示 gap锁 。
- LOCK_REC_NOT_GAP (十进制的 1024 ):也就是当第11个比特位置为1时,表示正经 记录锁
- LOCK_INSERT_INTENTION (十进制的 2048 ):也就是当第12个比特位置为1时,表示插入意向锁。其他的类型:还有一些不常用的类型我们就不多说了。
- is_waiting 属性呢?基于内存空间的节省,所以把 is_waiting 属性放到了 type_mode 这个32位的数字中:
- LOCK_WAIT (十进制的 256 ) :当第9个比特位置为 1 时,表示 is_waiting 为 true ,也就是当前事务尚未获取到锁,处在等待状态;当这个比特位为 0 时,表示 is_waiting 为false ,也就是当前事务获取锁成功。
5.其他信息:
为了更好的管理系统运行过程中生成的各种锁结构而设计了各种哈希表和
6.一堆比特位:
如果是 行锁结构 的话,在该结构末尾还放置了一堆比特位,比特位的数量是由上边提到的 n_bits 属性表示的。InnoDB数据页中的每条记录在 记录头信息 中都包含一个 heap_no属性,伪记录 Infimum 的heap_no 值为 0 , Supremum 的 heap_no 值为 1 ,之后每插入一条记录, heap_no 值就增1。 锁结构 最后的一堆比特位就对应着一个页面中的记录,一个比特位映射一个 heap_no ,即一个比特位映射到页内的一条记录。
5、锁监控
关于MySQL锁的监控,我们一般可以通过检查 InnoDB_row_lock 等状态变量来分析系统上的行锁的争夺情况
mysql> show status like ‘innodb_row_lock%’;
+———————————————-+———-+
| Variable_name | Value |
+———————————————-+———-+
| Innodb_row_lock_current_waits | 0 |
| Innodb_row_lock_time | 0 |
| Innodb_row_lock_time_avg | 0 |
| Innodb_row_lock_time_max | 0 |
| Innodb_row_lock_waits | 0 |
+———————————————-+———-+
5 rows in set (0.01 sec)
对各个状态量的说明如下:
- Innodb_row_lock_current_waits:当前正在等待锁定的数量;
- Innodb_row_lock_time :从系统启动到现在锁定总时间长度;(等待总时长)
- Innodb_row_lock_time_avg :每次等待所花平均时间;(等待平均时长)
- Innodb_row_lock_time_max:从系统启动到现在等待最常的一次所花的时间;
- Innodb_row_lock_waits :系统启动后到现在总共等待的次数;(等待总次数)
对于这5个状态变量,比较重要的3个见上面粗体
尤其时当等待次数很高,而且每次等待时长也不小的时候,我们就需要分析系统中为什么会有如此多的等待,然后根据分析结果着手指定优化计划。
其他监控方法:
MySQL把事务和锁的信息记录在了information_schema 库中,涉及到的三张表分别是INNODB_TRX、INNODB_LOCKS 和 INNODB_LOCK_WAITS。
MySQL5.7及之前 ,可以通过information_schema.INNODB_LOCKS查看事务的锁情况,但只能看到阻塞事务的锁;如果事务并未被阻塞,则在该表中看不到该事务的锁情况。
MySQL8.0删除了information_schema.INNODB_LOCKS,添加了 performance_schema.data_locks ,可以通过performance_schema.data_locks查看事务的锁情况,和MySQL5.7及之前不同,
performance_schema.data_locks不但可以看到阻塞该事务的锁,还可以看到该事务所持有的锁。
同时,information_schema.INNODB_LOCK_WAITS也被performance_schema.data_lock_waits所代替
模拟一个锁等待的场景
(1)查询正在被锁阻塞的sql语句。
SELECT FROM information_schema.INNODB_TRX\G;
重要属性代表含义已在上述中标注。
(2)查询锁等待情况
SELECT FROM data_lock_waits\G;
* 1. row *
ENGINE: INNODB
REQUESTING_ENGINE_LOCK_ID: 139750145405624:7:4:7:139747028690608
REQUESTING_ENGINE_TRANSACTION_ID: 13845 #被阻塞的事务IDREQUESTING_THREAD_ID: 72
REQUESTING_EVENT_ID: 26
REQUESTING_OBJECT_INSTANCE_BEGIN: 139747028690608
BLOCKING_ENGINE_LOCK_ID: 139750145406432:7:4:7:139747028813248
BLOCKING_ENGINE_TRANSACTION_ID: 13844 #正在执行的事务ID,阻塞了13845
BLOCKING_THREAD_ID: 71
BLOCKING_EVENT_ID: 24
BLOCKING_OBJECT_INSTANCE_BEGIN: 139747028813248
1 row in set (0.00 sec)
(3)查询锁的情况
mysql > SELECT * from performance_schema.data_locks\G;
6、间隙锁加锁的11种案例
间隙锁加锁规则(共11个案例)
间隙锁是在可重复读隔离级别下才会生效的:next-key lock 实际上是由间隙锁加行锁实现的,如果切换到读提交隔离级别 (read-committed) 的话,就好理解了,过程中去掉间隙锁的部分也就是只剩下行锁的部分。
而在读提交隔离级别下间隙锁就没有了,为了解决可能出现的数据和日志不一致问题,需要把binlog 格式设置为 row 。也就是说,许多公司的配置为:读提交隔离级别加 binlog_format=row。业务不需要可重复读的保证,这样考虑到读提交下操作数据的锁范围更小(没有间隙锁),这个选择是合理的。
next-key lock的加锁规则
==总结的加锁规则里面,包含了两个 “ “ 原则 ” ” 、两个 “ “ 优化 ” ” 和一个 “bug” 。==
- 原则 1 :加锁的基本单位是 next-key lock 。 next-key lock 是前开后闭区间。
- 原则 2 :查找过程中访问到的对象才会加锁。任何辅助索引上的锁,或者非索引列上的锁,最终都要回溯到主键上,在主键上也要加一把锁。
- 优化 1 :索引上的等值查询,给唯一索引加锁的时候, next-key lock 退化为行锁。也就是说如果InnoDB扫描的是一个主键、或是一个唯一索引的话,那InnoDB只会采用行锁方式来加锁
- 优化 2 :索引上(不一定是唯一索引)的等值查询,向右遍历时且最后一个值不满足等值条件的时候, next-key lock 退化为间隙锁。
- 一个 bug :唯一索引上的范围查询会访问到不满足条件的第一个值为止。
我们以表test作为例子,建表语句和初始化语句如下:其中id为主键索引
CREATE TABLE test (id int(11) NOT NULL,col1 int(11) DEFAULT NULL,col2 int(11) DEFAULT NULL,
PRIMARY KEY (id),
KEY c (c)
) ENGINE=InnoDB;
insert into test values(0,0,0),(5,5,5),
(10,10,10),(15,15,15),(20,20,20),(25,25,25);
==案例一:唯一索引等值查询间隙锁==
由于表 test 中没有 id=7 的记录
根据原则 1 ,加锁单位是 next-key lock , session A 加锁范围就是 (5,10] ; 同时根据优化 2 ,这是一个等值查询 (id=7) ,而 id=10 不满足查询条件, next-key lock 退化成间隙锁,因此最终加锁的范围是 (5,10)
==案例二:非唯一索引等值查询锁==
这里 session A 要给索引 col1 上 col1=5 的这一行加上读锁。
- 根据原则 1 ,加锁单位是 next-key lock ,左开右闭,5是闭上的,因此会给 (0,5] 加上 next-key lock。
- 要注意 c 是普通索引,因此仅访问 c=5 这一条记录是不能马上停下来的(可能有col1=5的其他记录),需要向右遍历,查到c=10 才放弃。根据原则 2 ,访问到的都要加锁,因此要给 (5,10] 加next-key lock
- 但是同时这个符合优化 2 :等值判断,向右遍历,最后一个值不满足 col1=5 这个等值条件,因此退化成间隙锁 (5,10) 。
- 根据原则 2 , 只有访问到的对象才会加锁,这个查询使用覆盖索引,并不需要访问主键索引,所以主键索引上没有加任何锁,这就是为什么 session B 的 update 语句可以执行完成。
但 session C 要插入一个 (7,7,7) 的记录,就会被 session A 的间隙锁 (5,10) 锁住 这个例子说明,锁是加在索引上的
执行 for update 时,系统会认为你接下来要更新数据,因此会顺便给主键索引上满足条件的行加上行锁
如果你要用 lock in share mode来给行加读锁避免数据被更新的话,就必须得绕过覆盖索引的优化,因为覆盖索引不会访问主键索引,不会给主键索引上加锁
==案例三:主键索引范围查询锁==
上面两个例子是等值查询的,这个例子是关于范围查询的,也就是说下面的语句
select from test where id=10 for update
select from tets where id>=10 and id<11 for update;
这两条查语句肯定是等价的,但是它们的加锁规则不太一样
- 开始执行的时候,要找到第一个 id=10 的行,因此本该是 next-key lock(5,10] 。 根据优化 1 ,主键id 上的等值条件,退化成行锁,只加了 id=10 这一行的行锁。
- 它是范围查询, 范围查找就往后继续找,找到 id=15 这一行停下来,不满足条件,因此需要加next-key lock(10,15] 。
session A 这时候锁的范围就是主键索引上,行锁 id=10 和 next-key lock(10,15] 。
首次 session A 定位查找id=10 的行的时候,是当做等值查询来判断的,而向右扫描到 id=15 的时候,用的是范围查询判断。
==案例四:非唯一索引范围查询锁==
与案例三不同的是,案例四中查询语句的 where 部分用的是字段 c ,它是普通索引
这两条查语句肯定是等价的,但是它们的加锁规则不太一样
在第一次用 col1=10 定位记录的时候,索引 c 上加了 (5,10] 这个 next-key lock 后,由于索引 col1 是非唯一索引,没有优化规则,也就是 说不会蜕变为行锁,因此最终 sesion A 加的锁是,索引 c 上的 (5,10] 和(10,15] 这两个 next-keylock
这里需要扫描到 col1=15 才停止扫描,是合理的,因为 InnoDB 要扫到 col1=15 ,才知道不需要继续往后找了。
==案例五:唯一索引范围查询锁 bug==
session A 是一个范围查询,按照原则 1 的话,应该是索引 id 上只加 (10,15] 这个 next-key lock ,并且因为 id 是唯一键,所以循环判断到 id=15 这一行就应该停止了。
但是实现上, InnoDB 会往前扫描到第一个不满足条件的行为止,也就是 id=20 。
而且由于这是个范围扫描,因此索引 id 上的 (15,20] 这个 next-key lock 也会被锁上。照理说,这里锁住 id=20 这一行的行为,其实是没有必要的。因为扫描到 id=15 ,就可以确定不用往后再找了
==案例六:非唯一索引上存在 “ “ 等值 “ “ 的例子==
这里,我给表 t 插入一条新记录:insert into t values(30,10,30);也就是说,现在表里面有两个c=10的行
但是它们的主键值 id 是不同的(分别是 10 和 30 ),因此这两个c=10 的记录之间,也是有间隙的
这次我们用 delete 语句来验证。注意, delete 语句加锁的逻辑,其实跟 select … for update 是类似的,也就是我在文章开始总结的两个 “ 原则 ” 、两个 “ 优化 ” 和一个 “bug” 。
这时, session A 在遍历的时候,先访问第一个 col1=10 的记录。同样地,根据原则 1 ,这里加的是(col1=5,id=5) 到 (col1=10,id=10) 这个 next-key lock 。
由于c是普通索引,所以继续向右查找,直到碰到 (col1=15,id=15) 这一行循环才结束。根据优化 2 ,这是一个等值查询,向右查找到了不满足条件的行,所以会退化成 (col1=10,id=10) 到 (col1=15,id=15) 的间隙锁
这个 delete 语句在索引 c 上的加锁范围,就是上面图中蓝色区域覆盖的部分。这个蓝色区域左右两边都是虚线,表示开区间,即 (col1=5,id=5) 和 (col1=15,id=15) 这两行上都没有锁
==案例七: limit 语句加锁==
例子 6 也有一个对照案例,场景如下所示:
session A 的 delete 语句加了 limit 2 。你知道表 t 里 c=10 的记录其实只有两条,因此加不加 limit 2 ,删除的效果都是一样的。但是加锁效果却不一样
这是因为,案例七里的 delete 语句明确加了 limit 2 的限制,因此在遍历到 (col1=10, id=30) 这一行之后,满足条件的语句已经有两条,循环就结束了。因此,索引 col1 上的加锁范围就变成了从( col1=5,id=5)到( col1=10,id=30) 这个前开后闭区间,如下图所示:
这个例子对我们实践的指导意义就是, 在删除数据的时候尽量加 limit 。
==这样不仅可以控制删除数据的条数,让操作更安全,还可以减小加锁的范围。==
==案例八:一个死锁的==
- session A 启动事务后执行查询语句加 lock in share mode ,在索引 col1 上加了 next-keylock(5,10] 和间隙锁 (10,15) (索引向右遍历退化为间隙锁);
- session B 的 update 语句也要在索引 c 上加 next-key lock(5,10] ,进入锁等待; 实际上分成了两步,先是加 (5,10) 的间隙锁,加锁成功;然后加 col1=10 的行锁,因为sessionA上已经给这行加上了读锁,此时申请死锁时会被阻塞
- 然后 session A 要再插入 (8,8,8) 这一行,被 session B 的间隙锁锁住。由于出现了死锁, InnoDB 让session B 回滚
==案例九:order by索引排序的间隙锁1==
如下面一条语句
begin;
select * from test where id>9 and id<12 order by id desc for update;
下图为这个表的索引id的示意图。
- 首先这个查询语句的语义是 order by id desc ,要拿到满足条件的所有行,优化器必须先找到 “ 第一个 id<12 的值 ” 。
- 这个过程是通过索引树的搜索过程得到的,在引擎内部,其实是要找到 id=12 的这个值,只是最终没找到,但找到了 (10,15) 这个间隙。( id=15 不满足条件,所以 next-key lock 退化为了间隙锁 (10,15)。)
- 然后向左遍历,在遍历过程中,就不是等值查询了,会扫描到 id=5 这一行,又因为区间是左开右闭的,所以会加一个next-key lock (0,5] 。 也就是说,在执行过程中,通过树搜索的方式定位记录的时候,用的是 “ 等值查询 ” 的方法。
==案例十:order by索引排序的间隙锁2==
- 由于是 order by col1 desc ,第一个要定位的是索引 col1 上 “ 最右边的 ”col1=20 的行。这是一个非唯一索引的等值查询:
左开右闭区间,首先加上 next-key lock (15,20] 。 向右遍历,col1=25不满足条件,退化为间隙锁 所以会加上间隙锁(20,25) 和 next-key lock (15,20] 。
- 在索引 col1 上向左遍历,要扫描到 col1=10 才停下来。同时又因为左开右闭区间,所以 next-keylock 会加到 (5,10] ,这正是阻塞session B 的 insert 语句的原因。
- 在扫描过程中, col1=20 、 col1=15 、 col1=10 这三行都存在值,由于是 select * ,所以会在主键id 上加三个行锁。 因此, session A 的 select 语句锁的范围就是:
- 索引 col1 上 (5, 25) ;
- 主键索引上 id=15 、 20 两个行锁。
==案例十一:update修改数据的例子-先插入后删除==
注意:根据 col1>5 查到的第一个记录是 col1=10 ,因此不会加 (0,5] 这个 next-key lock 。
session A 的加锁范围是索引 col1 上的 (5,10] 、 (10,15] 、 (15,20] 、 (20,25] 和(25,supremum]
之后 session B 的第一个 update 语句,要把 col1=5 改成 col1=1 ,你可以理解为两步:
- 插入 (col1=1, id=5) 这个记录;
- 删除 (col1=5, id=5) 这个记
通过这个操作, session A 的加锁范围变成了图 7 所示的样子:
好,接下来 session B 要执行 update t set col1 = 5 where col1 = 1 这个语句了,一样地可以拆成两步:
- 插入 (col1=5, id=5) 这个记录;
- 删除 (col1=1, id=5) 这个记录。 第一步试图在已经加了间隙锁的 (1,10) 中插入数据,所以就被堵住了。
