2、索引 - 2.2、索引结构 - 《mysql数据库》

MySQL的索引是在存储引擎层实现的，不同的存储引擎有不同的结构，主要包含以下几种：

索引结构在不同的引擎中的支持情况

我们平常所说的索引，如果没有特别指明，都是指B+树结构组织的索引。

⚫ 二叉树
一个节点下最多包含2个子节点，父节点的子节点相对于父节点左小右大

二叉树缺点：顺序插入时，会形成一个链表，查询性能大大降低。大数据量情况下，层级较深，检索速度慢。

为了规避二叉树的顺序插入的缺点，引入了另一种数据结构
红黑树：为了规避二叉树的顺序插入的缺点，大数据量情况下，层级较深，检索速度慢。

思考：2个子节点会导致层级很深，检索速度慢，我们能不能构建多个子节点呢？

⚫ B-Tree（多路平衡查找树）
以一颗最大度数（max-degree）为5(5阶)的b-tree为例(每个节点最多存储4个key，5个指针)：
度数=指针=key+1;

注意: 树的度数指的是一个节点的子节点个数。

具体动态变化的过程可以参考网站：链接
https://www.cs.usfca.edu/~galles/visualization/BTree.html

课堂案例：
插入 100 65 169 368 900 556 780 35 215 1200 234 888 158 90 1000 88 120 268 250 数据为例。

⚫ B+Tree
以一颗最大度数（max-degree）为4（4阶）的b+tree为例：

特点：所有的元素都会出现在子节点，分叶子节点只起到索引的作用，叶子节点形成一个单向链表。
插入 100 65 169 368 900 556 780 35 215 1200 234 888 158 90 1000 88 120 268 250 数据为例。
演示链接：https://www.cs.usfca.edu/~galles/visualization/BPlusTree.html

相对于B-Tree区别:
①. 所有的数据都会出现在叶子节点
②. 叶子节点形成一个单向链表

MySQL索引数据结构对经典的B+Tree进行了优化。在原B+Tree的基础上，增加一个指向相邻叶子节点的链表指针，就形成了带有顺序指针的B+Tree，提高区间访问的性能。

⚫ Hash
哈希索引就是采用一定的hash算法，将键值换算成新的hash值，映射到对应的槽位上，然后存储在hash表中。如果两个(或多个)键值，映射到一个相同的槽位上，他们就产生了hash冲突（也称为hash碰撞），可以通过链表来解决。

例如下图：为name字段创建hash索引的过程：
1.先算出每一行数据的hash值——>2.拿到name字段的所有值，针对name字段的所有值，通过内部的hash函数计算每一个name映射的槽位——>3.那么在对应槽位中就会存储key=name,value=key对应的行所对应的hash值

➢ Hash索引特点
1. Hash索引只能用于对等比较(=，in)，不支持范围查询（between，>，< ，…）
2. 无法利用索引完成排序操作
3. 查询效率高，通常只需要一次检索就可以了，效率通常要高于B+tree索引
➢ 存储引擎支持
在MySQL中，支持hash索引的是Memory引擎，而InnoDB中具有自适应hash功能，hash索引是存储引擎根据B+Tree索引在指定条件下自动构建的。

思考：

为什么InnoDB存储引擎选择使用B+tree索引结构，而没有选择：二叉树、B-tree、Hash?

➢ 相对于二叉树，层级更少，搜索效率高；
➢ 对于B-tree，无论是叶子节点还是非叶子节点，都会保存数据，这样导致一
页中存储的键值减少，指针跟着减少，要同样保存大量数据，只能增加树的
高度，导致性能降低；
➢ 相对Hash索引，B+tree支持范围匹配及排序操作；