索引 - 索引数据结构 - 《MySQL读书笔记》

为什么不用B-Tree（平衡多叉树/Balance Tree–B-Tree）？

查找关键字过程：

缺点

每个节点都有key，同时也包含data，而每个page存储空间是有限的，如果data比较大的话会导致每个节点存储的key数量变小（MySQL为了能更好的利用磁盘的IO能力，将操作页的大小设置为了16K，即每个节点的大小为16K，data放在节点上，key就存的少了）
当存储的数据量很大的时候会导致深度较大，增大查询时磁盘IO次数，进而影响查询性能

B+Tree是在B-Tree的基础上做的一种优化，非叶子节点存储key，叶子节点存储key和数据，每个磁盘块可以包含更多的节点：

包含更多的节点的好处：
1. 降低树的高度；
2. 将数据范围变为多个区间，区间越多，数据检索越快；
叶子节点两两指针相互连接（符合磁盘的预读特性），顺序查询性能更高。（B+Tree的叶子节点是顺序排列的，并且相邻的两个叶子节点中具有顺序引用的关系，这样能更好的支持了范围查询。）

在B+Tree上有两个头指针，一个指向根节点，另一个指向关键字最小的叶子节点，而且所有叶子节点（即数据节点）之间是一种链式环结构。因此可以对B+Tree进行两种査找运算：

问题：
如果此时要增加一个键值为14的数据，会怎么增加？
进行叶分裂，把磁盘块5分裂成两个，10&12一组，13&15一组，同时磁盘块2增加一个”13”的键值，磁盘块5再插入”14”，应该尽量减少叶分裂
**

无论是二叉树还是红黑树，都会因为树的深度过深而造成io次数变多，影响数据读取的效率
二叉树有个问题，就是在特殊情况下，它会退化成一个单向链表。这个时候，查询就相当于全表扫描；