通过下面这条 SQL 语句来检视创建的索引,大部分情况下可以定位出 90% 的索引创建不合理情况:
SELECTt.TABLE_SCHEMA,t.TABLE_NAME,INDEX_NAME,CARDINALITY,TABLE_ROWS,CARDINALITY / TABLE_ROWS AS SELECTIVITYFROMinformation_schema.TABLES t,(SELECTtable_schema,table_name,index_name,cardinalityFROMinformation_schema.STATISTICSWHERE (table_schema,table_name,index_name,seq_in_index) IN(SELECTtable_schema,table_name,index_name,MAX(seq_in_index)FROMinformation_schema.STATISTICSGROUP BY table_schema,table_name,index_name)) sWHERE t.table_schema = s.table_schemaAND t.table_name = s.table_nameAND t.table_rows != 0AND t.table_schema NOT IN ('mysql','performance_schema','information_schema')ORDER BY SELECTIVITY ;
上述的 SQL 语句利用了 information_schema 数据库下的元数据表 TABLES、STATISTICS。
- 表 TABLES 记录了表的基本信息,例如库名,表名,行数等。
 - 表 STATISTICS 记录了各个索引的 CARDINALITY 值。
 - 那么 CARDINALITY / TABLE_ROWS 表示的就是索引的选择性。
 
在 Inside 君的《MySQL技术内幕:InnoDB存储引擎》一书中明确指出的是,在 OLTP 的应用场景下,创建的索引是要求高选择性的。
若 CARDINALITY / TABLE_ROWS 小于10%(经验值),那么表示数据重复率较高,通常需要考虑是否有必要创建该索引。该语句运行的结果如下所示,列 SELECTIVITY 表示的就是选择性:
上述 SQL 语句并不能工作在 MySQL 5.6 版本下(即使最新的 MySQL 5.6.28 版本),因为目前 5.6 的 STATISTICS 表中关于 Cardinality 的统计是错误的。具体可见 MySQL bugs #78066。但是,表 innodb_index_stats 中关于 Cardinality 值得统计依然是正确的。
作者:殷建卫 链接:https://www.yuque.com/yinjianwei/vyrvkf/yh2y71 来源:殷建卫 - 架构笔记 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
