一、B树(B-tree、B-树)

B树是一种平衡的多路搜索树,多用于文件系统、数据库的实现
B树 - 图1
B树 - 图2

仔细观察B树,有什么眼前一亮的特点?
①、1 个节点可以存储超过 2 个元素、可以拥有超过 2 个子节点
②、拥有二叉搜索树的一些性质
③、平衡,每个节点的所有子树高度一致
④、比较矮

(一)m阶B树的性质(m≥2)

假设一个节点存储的元素个数为x
①、根节点:1 ≤ x ≤ m − 1
②、非根节点:┌ m/2 ┐ (向上取整)− 1 ≤ x ≤ m − 1
③、如果有子节点,子节点个数 y = x + 1
✓ 根节点:2 ≤ y ≤ m
✓ 非根节点:┌ m/2 ┐ ≤ y ≤ m
➢ 比如 m = 3,2 ≤ y ≤ 3,因此可以称为(2, 3)树、2-3树
➢ 比如 m = 4,2 ≤ y ≤ 4,因此可以称为(2, 4)树、2-3-4树
➢ 比如 m = 5,3 ≤ y ≤ 5,因此可以称为(3, 5)树
➢ 比如 m = 6,3 ≤ y ≤ 6,因此可以称为(3, 6)树
➢ 比如 m = 7,4 ≤ y ≤ 7,因此可以称为(4, 7)树

(二)B树 VS 二叉搜索树

B树 和 二叉搜索树,在逻辑上是等价的
B树 - 图3
多代节点合并,可以获得一个超级节点
①、2代合并的超级节点,最 多拥有 4 个子节点(至少是 4阶B树)
②、3代合并的超级节点,最多拥有 8 个子节点(至少是 8阶B树)
③、n代合并的超级节点,最多拥有 2n个子节点( 至少是 2n阶B树)
m阶B树,最多需要 log2m 代合并

(三)搜索

跟二叉搜索树的搜索类似
B树 - 图4
先在节点内部从小到大开始搜索元素
如果命中,搜索结束
如果未命中,再去对应的子节点中搜索元素,重复步骤 1

(四)添加

新添加的元素必定是添加到叶子节点
B树 - 图5
插入55
B树 - 图6
插入95
B树 - 图7
再插入 98 呢?(假设这是一棵 4阶B树)
①、最右下角的叶子节点的元素个数将超过限制
②、这种现象可以称之为:上溢(overflow)

(五)添加 – 上溢的解决(假设5阶)

上溢节点的元素个数必然等于m
B树 - 图8
假设上溢节点最中间元素的位置为 k
①、将 k 位置的元素向上与父节点合并
②、将 [0,k-1] 和 [k + 1,m - 1] 位置的元素分裂成 2 个子节点
B树 - 图9
✓ 这 2 个子节点的元素个数,必然都不会低于最低限制(┌ m/2 ┐ − 1)
一次分裂完毕后,有可能导致父节点上溢,依然按照上述方法解决
✓最极端的情况,有可能一直分裂到根节点
B树 - 图10
插入98
B树 - 图11
插入52
B树 - 图12
插入54
B树 - 图13

(六)删除 – 叶子节点

假如需要删除的元素在叶子节点中,那么直接删除即可
B树 - 图14
删除 30
B树 - 图15

(七)删除 – 非叶子节点

假如需要删除的元素在非叶子节点中
①、先找到前驱或后继元素,覆盖所需删除元素的值
②、再把前驱或后继元素删除
删除 60
B树 - 图16
非叶子节点的前驱或后继元素,必定在叶子节点中
①、所以这里的删除前驱或后继元素 ,就是最开始提到的情况:删除的元素在叶子节点中
②、真正的删除元素都是发生在叶子节点中

(八)删除 – 下溢

B树 - 图17

删除 22 ?(假设这是一棵 5阶B树)
①、叶子节点被删掉一个元素后,元素个数可能会低于最低限制( ≥ ┌ m/2 ┐ − 1 )
②、这种现象称为:下溢(underflow)
(八)删除 – 下溢的解决1
下溢节点的元素数量必然等于 ┌ m/2 ┐ − 2
B树 - 图18
如果下溢节点临近的兄弟节点,有至少 ┌ m/2 ┐ 个元素,可以向其借一个元素
①、将父节点的元素b 插入到下溢节点的0 位置(最小位置)
②、用兄弟节点的元素a(最大的元素)替代父节点的元素b
③、这种操作其实就是:旋转
B树 - 图19

(八)删除 – 下溢的解决2

如果下溢节点临近的兄弟节点,只有 ┌ m/2 ┐ − 1 个元素
①、将父节点的元素 b 挪下来跟左右子节点进行合并
②、合并后的节点元素个数等于┌ m/2 ┐ + ┌ m/2 ┐ − 2,不超过 m − 1
③、这个操作可能会导致父节点下溢,依然按照上述方法解决,下溢现象可能会一直往上传播
B树 - 图20