一、什么是脏页?脏数据?
- 什么是脏数据?
这个问题其实引出了脏读的概念。举个例子:事务A中读取到了事务B未提交的数据,这样的数据叫做脏数据。
- 什么是脏页?
为了加快响应客户端的速度,MySQL会在Buffer Pool中对数据进行修改,可是一旦你对LRU链表中的缓存页做了修改,那该页中的数据和磁盘中的数据页信息就不一致了!大家一般管这种数据页叫做脏页。
为了保证数据的最终一致性,MySQL是需要将脏页刷新回磁盘的!
但是问题是:需要将哪些数据页刷新回磁盘呢?这就引出了Flush List~
二、Flush链表的结构

Flush List 和 Free List很像,都是由Buffer Pool中数据描述信息组织而成的双向链表。
一旦你对内存中的缓存页作出了修改,那该缓冲页对应的描述信息块就会添加进 Flush List。这样当Buffer Pool中的数据页不够用时,我们就可以优先将 Flush List中的脏数据页刷新进磁盘中。
三、脏页刷盘时机
当Buffer Pool不够用时,根据LRU机制,MySQL会将Old SubList部分的缓存页移出LRU链表。如果被移除出去的缓存页的描述信息在Flush List中,MySQL就得将其刷新回磁盘。
**InnoDB存储引擎将脏页刷回磁盘的时机:
1、当MySQL关闭时,会将所有脏数据页刷新回磁盘。该功能由参数:innodb_fast_shutdown=0 控制,默认让InnoDB在关闭前将脏页刷回磁盘,以及清理掉undo log。
2、有一个后台线程Master Thread会按照每秒或者每十秒的速度,异步的将Buffer Pool中一定比例的页面刷新回磁盘中。
3、在MySQL5.7中,Buffer Pool的刷新由page cleaner threads完成。
- 我们可以通过 innodb_page_cleaners 参数控制page cleaner threads线程的数量,但是当你将这个数值调整的比Buffer Pool的数量还大时,MySQL会自动将 innodb_page_cleaners 数量设置为 innodb_buffer_pool_instances 的数量。
- Innodb1.1.x之前需要保证LRU列表中有至少100个空闲页可以使用。低于这个阈值就会触发脏页的刷新。
- 从MySQL5.6,也就是innodb1.2.X开始,innodb_lru_scan_depth 参数为每个缓冲池实例指定page cleaner threads 扫描Buffer Pool来查找要刷新的脏页的下行距离。默认为1024,该后台线程每秒都会执行一次。
4、当脏数据页太多时,也会触发将脏数据页刷新回磁盘。该机制可由参数innodb_nax_dirty_pages_pct 控制,比如将其设置为75,表示,当Buffer Pool中的脏数据页达到整体缓存的75%时,触发刷新的动作。现实情况是该参数默认值为0。以此来禁用Buffer Pool早期的刷新行为。
5、当redo log不可用时,也会强制脏页列表中的脏页刷新回磁盘。这个机制同样由一个后台线程完成。
四、刷新邻接数据页
刷新邻接数据页:意思是当MySQL将某脏页刷新回磁盘时,是否也以相同的态度将该脏页邻接的脏页一并刷新回磁盘。
可以通过参数 innodb_flush_neighbors 控制该过程。
- 设置为0时表示,禁用刷新邻接的功能。
- 设置为1时表示,以相同的态度刷新其邻接的脏页。
- 设置为2时表示,以相同的程度刷新脏页。
那如何选择将其设置为哪种状态呢?
你可以根据MySQL实例所在机器的存储类型来决定。如果为HDD存储建议将其开启,因为HDD的磁盘刷新速率较低,开启该参数后可以有效的减少IO操作。相反如果使用SSD存储,其本身就有高磁盘IO的特性,建议禁用该参数。
