回表操作
对于数据库来说,只要涉及到索引,必然绕不过去回表操作。当然这也是索引下推内容的前调基础。
说到回表,需要从索引开始说起。别担心,不会长篇大论,这里只是简单讲下主键索引与普通索引,目的是让大家对回表操作有个认识。如果对回表操作很熟悉了,那么可以跳过这一段。
这里只以 Innodb 存储引擎作为讲解对象。
主键索引
主键索引在底层的数据存储是通过 B+ 树来实现的。简单来说,就是除叶子节之外的其他节点都存储的是主键值。而叶子节点上存储的是整行的数据。
大体结构如下图所示。
非主键索引
除了主键索引外,其它的索引都被称为非主键索引。与主键索引不同的是,非主键索引的叶子节点上存储的是主键的值。
再回到开始的问题,什么是回表操作?
在非主键索引上查找一行数据的时候,此时的查找方式是先搜索非主键索引树,拿到对应的主键值,再到主键索引树上查找对应的行数据。
这种操作就叫作回表操作。
这里应该了解了什么是回表操作了。简单来讲,就是在非主键索引树上拿到对应的主键值,然后回到主键索引上找到对应的行数据。
这样做的前提条件是,所要查找的字段不存在于非主键索引树上。
低版本操作
继续回到主题——索引下推。
其实在 MySQL5.6 版本之前是没有索引下推这个功能的,从 5.6 版本后才加上了这个优化项。所以在引出索引下推前还是先回顾下没有这个功能时是怎样一种处理方式。
以一个真实例子来进行讲解。
在这里有张用户表 user,记录着用户的姓名,性别,身高,年龄等信息。表中 id 是自增主键,(name,sex) 是联合索引。在这里用 1 表示男,2 表示女。现在需要查找所有姓王的男性信息。
SQL 实现起来很简单:
但是它的实现原理是什么呢?
根据联合索引最左前缀原则,在非主键索引树上找到第一个满足条件的值时,通过叶子节点记录的主键值再回到主键索引树上查找到对应的行数据,再对比是否为当前所要查找的性别。
整个原理可以用下边的图进行表示。
低版本中需要每条数据都进行回表,增加了树的搜索次数。如果遇到所要查找的数据量很大的话,性能必然有所缺失。
高版本操作
讲完了低版本操作,继续回到主题——索引下推。
知道了痛点,那么怎么解决。很简单,只有符合条件了再进行回表。结合例子来说就是当满足了性别 sex = 1 了,再回表查找。这样原本可能需要进行回表查找 4 次,现在可能只需要 2 次就可以了。
所以本质来说,索引下推就是只有符合条件再进行回表,对索引中包含的字段先进行判断,不符合条件的跳过。减少了不必要的回表操作。