Explain 性能分析
使用 EXPLAIN 关键字可以模拟优化器执行 SQL 查询语句,从而知道 MySQL 是如何处理你的 SQL 语句的。分析你的查询语句或是表结构的性能瓶颈。
- 表的读取顺序
- 数据读取操作的数据类型
- 哪些索引可以使用
- 哪些索引被实际使用
- 表之间的引用
- 每张表有多少行被优化器查询
用法:
EXPALIN SELECT * FROM t1;
Explain 执行后返回的信息:
下面分别介绍其含义。
id
select 查询的序列号,包含一组数字,表示查询中执行 select 子句或操作表的顺序。
- id 相同,执行顺序由上至下,t1-t3-t2
- id 不同,如果是子查询,id 的序号会递增,id 值越大优先级越高,越先被执行 t3-t2-t1
- 有相同也有不同
id 如果相同,可以认为是一组,从上往下顺序执行;
在所有组中,id 值越大,优先级越高,越先执行
衍生 = DERIVED , derived2 指 id = 2
关注点:id 号每个号码,表示一趟独立的查询。一个 sql 的查询趟数越少越好。
select_type
select_type 代表查询的类型,主要是用于区别普通查询、联合查询、子查询等的复杂查询。
SIMPLE:简单的 select 查询,查询中不包含子查询或者 UNION;
PRIMARY:查询中若包含任何复杂的子部分,最外层查询被标记为 PRIMARY,最后被加载;
SUBQUERY:在 select 或 where 列表中包含子查询;
DERIVED:在 from 列表中包含的子查询被标记为 DERIVED(衍生),MySQL 会递归执行这些子查询,把结果放在临时表里;
UNION:若第二个 select 出现在 UNION之后,则被标记为 UNION;若 UNION 包含在 from 子句的子查询中,外层 select 将被标记为 DERIVED;
UNION RESULT:从 UNION 表获取结果的 select
https://dev.mysql.com/doc/refman/8.0/en/explain-output.html#explain_select_type
SIMPLE
简单的 select 查询,查询中不包含子查询或者 UNION,即单表查询。
PRIMARY
最外层的查询,查询中若包含任何复杂的子部分,最外层查询则被标记为 Primary
DERIVED
在 FROM 列表中包含的子查询被标记为 DERIVED(衍生),MySQL 会递归执行这些子查询, 把结果放在临时表里。
SUBQUERY
在 SELECT 或 WHERE 列表中包含了子查询。
DEPEDENT SUBQUERY
在 SELECT 或 WHERE 列表中包含了子查询, 子查询基于外层。
都是 where 后面的条件,subquery 是单个值,dependent subquery 是一组值。
UNCACHEABLE SUBQUERY
无法使用缓存的子查询
当使用了@@来引用系统变量的时候,不会使用缓存。
UNION
若第二个 SELECT 出现在 UNION 之后,则被标记为 UNION;
若 UNION 包含在 FROM 子句的子查询中,外层 SELECT 将被标记为:DERIVED
UNION RESULT
从 UNION 表获取结果的SELECT
table
显示这个数据是基于哪张表的。
type
显示查询使用了哪种类型。是较为重要的一个指标,结果值从最好到最坏依次是:
system > const > eq_ref > ref > range > index > ALL
system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index >ALL
一般来说,得保证查询至少达到 range 级别,最好能达到 ref。
system
表只有一行记录(等于系统表),这是 const 类型的特列,平时不会出现,这个也可以忽略不计
const
表示通过索引一次就找到了,const 用于比较 primary key 或者 unique 索引。因为只匹配一行数据,所以很快。如将主键置于 where 列表中,MySQL 就能将该查询转换 为一个常量。
eq_ref
唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描。
ref
非唯一性索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体。
没用索引前:
建立索引后:
range
只检索给定范围的行, 使用一个索引来选择行。key 列显示使用了哪个索引一般就是在你的 where 语句中出现了 between
、<
、>
、in
等的查询这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,而结束于另一点,不用扫描全部索引。
index
Full Index Scan 全索引检索,index 和 all 的区别为 index 类型只遍历索引树,这通常比 all 快。因为索引文件通常比数据文件小。(也就是说,虽然 all 和 index 都是读全表,但 index 是从索引中读取的,而 all 是从硬盘中读取的)
出现 index 是 sql 使用了索引但是没有通过索引进行过滤,一般是使用了覆盖索引或者是利用索引进行了排序分组。
all
Full Table Scan,将遍历全表以找到匹配的行。
index_merge
在查询过程中需要多个索引组合使用,通常出现在有 or 的关键字的 sql 中。
ref_or_null
对于某个字段既需要关联条件,也需要 null 值得情况下。查询优化器会选择用 ref_or_null 连接查询。
index_subquery
利用索引来关联子查询,不再全表扫描。
unique_subquery
该联接类型类似于 index_subquery。 子查询中的唯一索引。
possible_keys
显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段上若存在索引,则该索引将被列出, 但不一**定被查询实际使用。**
key
实际使用的索引。如果为 NULL,则没有使用索引。
查询中若使用了覆盖索引(select 查询字段和创建索引字段一一对应),则该索引仅出现在 key 列表中。
key_len
表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精度的前提下,长度越短越好。
ken_len 显示的值为索引字段的最大可能长度,并非实际使用长度,即 key_len 是根据表定义计算而得,不是通过表内检索出的。
key_len 字段能够帮你检查是否充分的利用上了索引。ken_len 越长,说明索引使用的越充分。
如何计算:
①先看索引上字段的类型+长度比如 int=4 ; varchar(20) =20 ; char(20) =20
②如果是 varchar 或者 char 这种字符串字段,视字符集要乘不同的值,比如 utf-8 要乘 3,GBK 要乘 2,
③varchar 这种动态字符串要加 2 个字节
④允许为空的字段要加 1 个字节
第一组:key_len=age 的字节长度+name 的字节长度=4+1 + ( 20*3+2)=5+62=67
第二组:key_len=age 的字节长度=4+1=5
ref
显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值,一般显示为 库.表.字段。
rows
rows 列显示 MySQL 认为它执行查询时必须检查的行数。越少越好!
根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数。
Extra
其他的额外重要的信息。
Using filesort
说明 mysql 会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL 中无法利用索引完成的排序操作称为“文件排序”。
即 order by 后面的字段不在索引字段内或不按照组合索引顺序出现,导致重新文件排序。
- 出现 filesort 的情况:
- 优化后,不再出现 filesort 的情况:
查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度。
Using temporary
使了用临时表保存中间结果, MySQL 在对查询结果排序时使用临时表。常见于排序 order by 和分组查询 group by。
- 优化前:
- 优化后:
Using index
Using index 代表表示相应的 select 操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效率不错!
如果同时出现 using where,表明索引被用来执行索引键值的查找;
如果没有同时出现 using where,表明索引只是用来读取数据而非利用索引执行查找。
利用索引进行了排序或分组。
Using where
表明使用了 where 过滤。
Using join buffer
使用了连接缓存。
impossible where
where 子句的值总是 false,不能用来获取任何元组。
select tables optimized away
在没有 GROUPBY 子句的情况下,基于索引优化 MIN/MAX 操作或者对于 MyISAM 存储引擎优化 COUNT(*) 操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。
- 在 innodb 中:
- 在 Myisam 中:
distinct
优化 distinct 操作,在找到第一匹配的元组后即停止找同样值的操作。
小试牛刀-SQL的执行顺序
- 第一行(执行顺序4):id 列为 1,表示是 union 里的第一个 select,select_type 列的 primary 表示该查询为外层查询,table 列被标记为
,表示查询结果来自一个衍生表, 其中 3
代表该查询衍生自 id 为 3 的 select 查询。【select d1.name …】 - 第二行(执行循序2):id 为 3,是整个查询第三个 select 的一部分。因查询包含在 from 中,所以为 DERIVED。【select id, name from t1 where other_column = ‘’】
- 第三行(执行顺序3):select 列表中的子查询 select_type 为 subquery,为整个查询的第二个 select。【select id from t3】
- 第四行(执行顺序1):select_type 为 union,说明第四个 select 是 union 里的第二个 select,最先执行。【select name, id from t2】
- 第五航(执行顺序5):代表从 union 的临时表中读取行的阶段,table 列的
表示用id 为 1 和 id 为 4 的 select 的结果进行的 union 操作。【两个结果的 union 操作】