前言

面试官:“讲讲mysql有几个事务隔离级别?”
你:“读未提交,读已提交,可重复读,串行化四个!默认是可重复读”
面试官:“为什么mysql选可重复读作为默认的隔离级别?”
(你面露苦色,不知如何回答!)
面试官:”你们项目中选了哪个隔离级别?为什么?”
你:“当然是默认的可重复读,至于原因。。呃。。。”
面试官: “回去等通知吧”

正文

1. 四大事务隔离级别是什么?

1)Read uncommitted(读未提交):
如果一个事务已经开始写数据,则另外一个事务不允许同时进行写操作,但允许其他事务读此行数据,该隔离级别可以通过“排他写锁”,但是不排斥读线程实现。这样就避免了更新丢失,却可能出现脏读,也就是说事务B读取到了事务A未提交的数据
解决了更新丢失,但还是可能会出现脏读
2)Read committed(读已提交)
如果是一个读事务(线程),则允许其他事务读写,如果是写事务将会禁止其他事务访问该行数据,该隔离级别避免了脏读,但是可能出现不可重复读。事务A事先读取了数据,事务B紧接着更新了数据,并提交了事务,而事务A再次读取该数据时,数据已经发生了改变。
解决了更新丢失和脏读问题,但是会出现不可重复读的问题
3)Repeatable read(可重复读)
可重复读取是指在一个事务内,多次读同一个数据,在这个事务还没结束时,其他事务不能访问该数据(包括了读写),这样就可以在同一个事务内两次读到的数据是一样的,因此称为是可重复读隔离级别,读取数据的事务将会禁止写事务(但允许读事务),写事务则禁止任何其他事务(包括了读写),这样避免了不可重复读和脏读,但是有时可能会出现幻读。(读取数据的事务)可以通过“共享读镜”和“排他写锁”实现。解决了更新丢失、脏读、不可重复读、但是还会出现幻读
4)Serializable(串行化)
提供严格的事务隔离,它要求事务序列化执行,事务只能一个接着一个地执行,但不能并发执行,如果仅仅通过“行级锁”是无法实现序列化的,必须通过其他机制保证新插入的数据不会被执行查询操作的事务访问到。序列化是最高的事务隔离级别,同时代价也是最高的,性能很低,一般很少使用,在该级别下,事务顺序执行,不仅可以避免脏读、不可重复读,还避免了幻读
解决了更新丢失、脏读、不可重复读、幻读(虚读)
image.png

2.Mysql 和Oracle 默认隔离级别?

  1. MYSQL数据库中,支持上面四种隔离级别,默认的为Repeatable read(可重复读);而在Oracle数据库中,只支持Serializeble(串行化)级别和Read committed(读已提交)这两种级别,其中默认的为Read committed级别.<br /> 那么互联网项目中Mysql也是使用Repeatable read 做为默认的隔离级别么,并不是,一般用Read Comminted 这个隔离级别<br /> what!居然是读已提交,网上不是说这个隔离级别存在不可重复读和幻读问题么?不用管么?<br /> 我们先来思考一个问题,在OracleSqlServer中都是选择**读已提交(Read Commited)**作为默认的隔离级别,为什么Mysql不选择**读已提交(Read Commited)**作为默认隔离级别,而选择**可重复读(Repeatable Read)**作为默认的隔离级别呢?

3.为什么Mysql要选择Repeatable Read 可重复读作为默认隔离级别

这是有历史原因的,这要从我们的主从复制开始讲起了
什么是主从复制?
主从复制,是基于Binlog的复制, 关于Binlog的概念又可以开一篇文章讲起了,这里可以简单理解一下,Binlog就是记录数据库更改的文件,记录什么样的更改呢,有三种记录方式:

  • statement: 记录的是修改SQL语句,如update, delete等操作语句
  • row:记录的是每行实际数据的变更 ,就是从每行数据变更就保存一次该行的数据
  • mixed:statement和row模式的混合

那Mysql在5.0这个版本以前,binlog只支持STATEMENT这种格式!而这种格式在读已提交(Read Commited)这个隔离级别下主从复制是有bug的,因此Mysql将可重复读(Repeatable Read)作为默认的隔离级别! 接下来,就要说说当binlog为STATEMENT格式,且隔离级别为读已提交(Read Commited)时,有什么bug呢?如下图所示,在主(master)上执行如下事务
image.png
此时在主(master)上执行下列语句
select from test;
输出如下
+—-+
| b |
+—-+
| 3 |
+—-+
1 row in set
但是,你在此时在从(slave)上执行该语句,得出输出如下
Empty set
这样,你就出现了主从不一致性的问题!原因其实很简单,就是在master上执行的顺序为先删后插!而此时binlog为STATEMENT格式,它记录的顺序为先插后删!从(slave)同步的是binglog,因此从机执行的顺序和主机不一致!就会出现主从不一致!
如何解决?
解决方案有两种!
(1)隔离级别设为可重复读(Repeatable Read),在该隔离级别下引入间隙锁。当Session 1执行delete语句时,会锁住间隙。那么,Ssession 2执行插入语句就会阻塞住!
(2)将binglog的格式修改为row格式,此时是基于行的复制,自然就不会出现sql执行顺序不一样的问题!奈何这个格式在mysql5.1版本开始才引入。因此由于历史原因,mysql将默认的隔离级别设为可重复读(Repeatable Read),保证主从复制不出问题!
那么,当我们了解完mysql选可重复读(Repeatable Read)作为默认隔离级别的原因后,接下来我们将其和读已提交(Read Commited)进行对比,来说明为什么在互联网项目为什么将隔离级别设为*读已提交(Read Commited)

4.对比

ok,我们先明白一点!项目中是不用读未提交(Read UnCommitted)串行化(Serializable)两个隔离级别,原因有二

  • 采用读未提交(Read UnCommitted),一个事务读到另一个事务未提交读数据,这个不用多说吧,从逻辑上都说不过去!
  • 采用串行化(Serializable),每个次读操作都会加锁,快照读失效,一般是使用mysql自带分布式事务功能时才使用该隔离级别!(笔者从未用过mysql自带的这个功能,因为这是XA事务,是强一致性事务,性能不佳!互联网的分布式方案,多采用最终一致性的事务解决方案!)

也就是说,我们该纠结都只有一个问题,究竟隔离级别是用读已经提交呢还是可重复读? 接下来对这两种级别进行对比,讲讲我们为什么选读已提交(Read Commited)作为事务隔离级别! 假设表结构如下
CREATE TABLE test (
id int(11) NOT NULL,
color varchar(20) NOT NULL,
PRIMARY KEY (id)
) ENGINE=InnoDB
数据如下
+——+———-+
| id | color |
+——+———-+
| 1 | red |
| 2 | white |
| 5 | red |
| 7 | white |
+——+———-+
为了便于描述,下面将

  • 可重复读(Repeatable Read),简称为RR;
  • 读已提交(Read Commited),简称为RC;

缘由一:在RR隔离级别下,存在间隙锁,导致出现死锁的几率比RC大的多!
此时执行语句
select * from test where id <3 for update;
在RR隔离级别下,存在间隙锁,可以锁住(2,5)这个间隙,防止其他事务插入数据! 而在RC隔离级别下,不存在间隙锁,其他事务是可以插入数据!
ps:在RC隔离级别下并不是不会出现死锁,只是出现几率比RR低而已!
缘由二:在RR隔离级别下,条件列未命中索引会锁表!而在RC隔离级别下,只锁行
此时执行语句
update test set color = ‘blue’ where color = ‘white’;
在RC隔离级别下,其先走聚簇索引,进行全部扫描。加锁如下:
image.png
但在实际中,MySQL做了优化,在MySQL Server过滤条件,发现不满足后,会调用unlockrow方法,把不满足条件的记录放锁。
image.png
然而,在RR隔离级别下,走聚簇索引,进行全部扫描,最后会将整个表锁上,如下所示
image.png
缘由三:在RC隔离级别下,半一致性读(semi-consistent)特性增加了update操作的并发性!_
在5.1.15的时候,innodb引入了一个概念叫做“semi-consistent”,减少了更新同一行记录时的冲突,减少锁等待。 所谓半一致性读就是,一个update语句,如果读到一行已经加锁的记录,此时InnoDB返回记录最近提交的版本,由MySQL上层判断此版本是否满足update的where条件。若满足(需要更新),则MySQL会重新发起一次读操作,此时会读取行的最新版本(并加锁)! 具体表现如下:
此时有两个Session,Session1和Session2!
Session1执行
update test set color = ‘blue’ where color = ‘red’;
先不Commit事务!
与此同时Ssession2执行
update test set color = ‘blue’ where color = ‘white’;
session 2尝试加锁的时候,发现行上已经存在锁,InnoDB会开启semi-consistent read,返回最新的committed版本(1,red),(2,white),(5,red),(7,white)。MySQL会重新发起一次读操作,此时会读取行的最新版本(并加锁)! 而在RR隔离级别下,Session2只能等待!

5.两个疑问

在RC级别下,不可重复读问题需要解决么? 不用解决,这个问题是可以接受的!毕竟你数据都已经提交了,读出来本身就没有太大问题!Oracle的默认隔离级别就是RC,你们改过Oracle的默认隔离级别么?
在RC级别下,主从复制用什么binlog格式? OK,在该隔离级别下,用的binlog为row格式,是基于行的复制!Innodb的创始人也是建议binlog使用该格式!