1. 为什么使用索引
索引是存储引擎用于快速找到数据记录的一种数据结构,就好比一本字典,通过目录找到对应汉字的页码,可以快速定位,MySQL也是一样的道理,进行数据查找时,首先查看查询条件是否命中某条索引,符合则通过索引查找
相关数据,如果不符合择需要全表扫描
,即需要一条一条地查找记录,直到找到与条件符合的记录
假如给数据使用 二叉树 这样的数据结构进行存储,如下图所示
2. 索引及其优缺点
2.1 索引概述
MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。 索引的本质:索引是数据结构。你可以简单理解为“排好序的快速查找数据结构”,满足特定查找算法。 这些数据结构以某种方式指向数据, 这样就可以在这些数据结构的基础上实现 高级查找算法
。索引是在存储引擎中实现的
,因此每种存储引擎的索引不一定完全相同,并且每种存储引擎不一定支持所有索引类型。同时,存储引擎可以定义每个表的最大索引数
和最大索引长度
。所有存储引擎支持每个表至少16个索引,总索引长度至少为256个字节,有些存储引擎支持更多的索引数和更大的索引长度。
2.2 优点
(1)类似大学图书馆建书目索引,提高数据检索的效率,降低 数据库的IO成本
,这也是创建索引最主 要的原因。
(2)通过创建唯一索引,可以保证数据库表中每一行 数据的唯一性
。
(3)在实现数据的 参考完整性方面,可以 加速表和表之间的连接
。换句话说,对于有依赖关系的子表和父表联合查询时, 可以提高查询速度。
(4)在使用分组和排序子句进行数据查询时,可以显著 减少查询中分组和排序的时间
,降低了CPU的消耗。
2.3 缺点
增加索引也有许多不利的方面,主要表现在如下几个方面:
(1)创建索引和维护索引要 耗费时间
,并 且随着数据量的增加,所耗费的时间也会增加。
(2)索引需要占 磁盘空间
,除了数据表占数据空间之 外,每一个索引还要占一定的物理空间, 存储在磁盘上
,如果有大量的索引,索引文件就可能比数据文 件更快达到最大文件尺寸。
(3)虽然索引大大提高了查询速度,同时却会 降低更新表的速度
。当对表 中的数据进行增加、删除和修改的时候,索引也要动态地维护,这样就降低了数据的维护速度。
因此,选择使用索引时,需要综合考虑索引的优点和缺点。
3. InnoDB中索引的推演
3.1 索引之前的查找
SELECT [列名列表] FROM 表名 WHERE 列名 = xxx;
1. 在一个页中的查找
一页=16kb 大小数据
假设目前表中的记录比较少,所有的记录都可以被存放在一个页中,在查找记录的时候可以根据搜索条件的不同分为两种情况:
- 以主键为搜索条件
- 可以在页目录中使用
二分法
快速定位到对应的槽,然后再遍历该槽对应分组中的记录即可快速找到指定的记录。
- 可以在页目录中使用
- 以其他列作为搜索条件
- 定位到记录所在的页。
- 从所在的页内查找相应的记录。
在没有索引的情况下,不论是根据主键列或者其他列的值进行查找,由于我们并不能快速的定位到记录所在的页,所以只能从第一个页沿着双向链表一直往下找,在每一个页中根据我们上面的查找方式去查找指定的记录。因为要遍历所有的数据页,所以这种方式显然是超级耗时的。