使用explain关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的,分析你的查询语句或是表结构的性能瓶颈。

explain执行计划包含的信息

Mysql执行计划概述 - 图1

其中最重要的字段为:id、type、key、rows、Extra

id

select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序

三种情况:

  1. id相同:执行顺序由上至下
    Mysql执行计划概述 - 图2
  2. id不同:如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
    Mysql执行计划概述 - 图3
  3. id相同又不同(两种情况同时存在):id如果相同,可以认为是一组,从上往下顺序执行;在所有组中,id值越大,优先级越高,越先执行
    Mysql执行计划概述 - 图4

    select_type

查询的类型,主要是用于区分普通查询、联合查询、子查询等复杂的查询

  1. SIMPLE:简单的select查询,查询中不包含子查询或者union
  2. PRIMARY:查询中包含任何复杂的子部分,最外层查询则被标记为primary
  3. SUBQUERY:在select 或 where列表中包含了子查询
  4. DERIVED:在from列表中包含的子查询被标记为derived(衍生),mysql或递归执行这些子查询,把结果放在零时表里
  5. UNION:若第二个select出现在union之后,则被标记为union;若union包含在from子句的子查询中,外层select将被标记为derived
  6. UNION RESULT:从union表获取结果的select
    Mysql执行计划概述 - 图5

    type

访问类型,sql查询优化中一个很重要的指标,结果值从好到坏依次是:

system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL

一般来说,好的sql查询至少达到range级别,最好能达到ref。详情请参考下一节。

possible_keys

查询涉及到的字段上存在索引,则该索引将被列出,但不一定被查询实际使用

key

实际使用的索引,如果为NULL,则没有使用索引。

查询中如果使用了覆盖索引,则该索引仅出现在key列表中
Mysql执行计划概述 - 图6
Mysql执行计划概述 - 图7

key_len

表示索引中使用的字节数,查询中使用的索引的长度(最大可能长度),并非实际使用长度,理论上长度越短越好。key_len是根据表定义计算而得的,不是通过表内检索出的

ref

显示索引的那一列被使用了,如果可能,是一个常量const。

rows

根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数

Extra

不适合在其他字段中显示,但是十分重要的额外信息。详情请参考下一节。

复合索引的最左前缀原则

MySQL中的复合索引,查询时只会使用到最左前缀。

例如下面对复合索引的非最左前缀字段进行 OR 运算,是无法使用到复合索引的

  1. SELECT * FROM tbl_name WHERE (key_col1 > 10 OR key_col2 = 20) AND nonkey_col=30;

其原因是,MySQL中的索引,使用的是B+tree, 也就是说他是:先按照复合索引的第一个字段的大小来排序,插入到 B+tree 中的,当第一个字段值相同时,在按照第二个字段的值比较来插入的。

那么如果我们需要对: OR key_col2 = 20 这样的条件也使用复合索引,那么该怎么操作呢?应该要对复合索引进行全扫描,找出所有 key_col2 =20 的项,然后还要回表去判断 nonkey_col=30,显然代价太大了。所以一般而言 OR key_col2 = 20 这样的条件是无法使用到复合索引的。如果一定要使用索引,那么可以在 col2 上单独建立一个索引。

注意最左前缀,并不是是指:一定要按照各个字段出现在where中的顺序来建立复合索引的。比如

  1. where status=2 and roleId=xxx and number = xxx

该条件建立符合索引,我们并不需要按照status,roleId,number它们出现的顺序来建立索引:

  1. alter table role_goods add index sin(status,roleId,number)

这是对最左前缀极大的误解。因为 where status=2 and roleId=xxx and number = xxx 和 where roleId=xxx and number = xxx and status=2它们是等价的。复合索引,哪个字段放在最前面,需要根据哪个字段经常出现在where条件中,哪个字段的选择性最好来判断的

综合Case

Mysql执行计划概述 - 图8

执行顺序

1(id = 4)【select id, name from t2】:select_type 为union,说明id=4的select是union里面的第二个select。

2(id = 3)【select id, name from t1 where address = ‘11’】:因为是在from语句中包含的子查询所以被标记为DERIVED(衍生),where address = ‘11’ 通过复合索引idx_name_email_address就能检索到,所以type为index。

3(id = 2)【select id from t3】:因为是在select中包含的子查询所以被标记为SUBQUERY。

4(id = 1)【select d1.name, … d2 from … d1】:select_type为PRIMARY表示该查询为最外层查询,table列被标记为 “derived3”表示查询结果来自于一个衍生表(id = 3 的select结果)。

5(id = NULL)【 … union … 】:代表从union的临时表中读取行的阶段,table列的 “union 1, 4”表示用id=1 和 id=4 的select结果进行union操作。