9、线段树 - 《数据结构》

一：什么是线段树
二：线段树的基础表示
三：创建线段树
四：线段树中的区间查询
五：修改线段树
六：自下而上创建线段树
- 更新线段树
- 区域查询
六：线段树的更多操作

【数据结构与算法基础】代码仓库：https://github.com/jinrunheng/datastructure-and-algorithm

一：什么是线段树

线段树（Segment Tree），是 1977 年由 Jon Louis Bentley 发明的一种数据结构，用以存储区间或线段，并且允许快速查询结构内包含某一点的所有区间。

线段树主要用于区间内的查询和统计，例如，我们有如下数组：

如果我们查询区间 [n,m] 的最大值，最小值或者是这个区间的数字和，很显然，对于数组这样的线性数据结构来说时间复杂度为 O(N)。

我们可以将这个数组构建成一棵线段树：

线段树的每一个节点存储着一段区间的信息，譬如我们的需求为查询 [n,m] 这个区间的数字和，那么线段树的节点存储的就是某个区间数字和的信息。

如果我们要查询 [2,5] 这个区间的数字和

使用线段树这种数据结构，我们就可以快速获取到我们需要查询的区间信息。

二：线段树的基础表示

线段树是一棵平衡二叉树（Balanced Binary Tree），平衡二叉树具有的性质为：树的最大深度与最小深度的高度差不超过 1

所以，对于线段树查找的时间复杂度为 O(logN)。

那么，如果数组中有 n 个元素，将这个数组表示为线段树的话，一共需要构建多少个节点呢？

如果，n 满足：

我们需要开辟 2n 的空间去构建线段树；

否则，n 满足：

我们就需要开辟 4n 的空间去构建线段树。

因为我们不打算考虑将线段树构建成动态的数据结构，所以使用 4n 的静态空间即可。

三：创建线段树

代码链接🔗

如果给定的数组为 arr，我们只需要开辟一个 4 * arr.length 的数组 tree 来保存线段树的节点信息即可。

建树的方式也非常简单，整体使用递归的思想，譬如我们要建立一个查询数组区间和的线段树，创建线段树代码如下：

// 在 treeIndex 的位置创建区间为 [l...r] 的线段树
void buildSegmentTree(int treeIndex,int l,int r){
    if(l == r) {
        tree[treeIndex] = arr[l]; 
        return;
    }
    int leftTreeIndex = treeIndex * 2 + 1;
    int rightTreeIndex = treeIndex * 2 + 2;
    int mid = l + ((r - l) >> 1);
    buildSegmentTree(leftTreeIndex,l,mid);
    buildSegmentTree(rightTreeIndex,mid + 1,r);
    tree[treeIndex] = tree[leftTreeIndex] + tree[rightTreeIndex];
}

该方法的时间复杂度为：O(N)。

四：线段树中的区间查询

代码链接🔗

线段树的区间查询同样使用的是递归的思想，我们依旧以查询数组区间和来作为示例，代码如下：

/**
 * 在 treeIndex 为根的线段树中 [l...r] 的范围里，搜索区间 [queryL...queryR] 的值
 *
 * @param treeIndex
 * @param l
 * @param r
 * @param queryL
 * @param queryR
 * @return
 */
int query(int treeIndex, int l, int r, int queryL, int queryR) {
    if (queryL < 0 || queryL >= data.length
            || queryR < 0 || queryR >= data.length
            || queryL > queryR)
        throw new IllegalArgumentException("Index is illegal");
    if(l == queryL && r == queryR){
        return tree[treeIndex];
    }
    int mid = l + ((r - l) >> 1);
    int leftTreeIndex = treeIndex * 2 + 1;
    int rightTreeIndex = treeIndex * 2 + 2;
    if (queryL > mid) {// 如果查找的区间范围只在右子树中
        return query(rightTreeIndex, mid + 1, r, queryL, queryR);
    } else if (queryR < mid + 1) {// 如果查找的区间范围只在左子树中
        return query(leftTreeIndex, l, mid, queryL, queryR);
    }
    int leftResult = query(leftTreeIndex, l, mid, queryL, mid);
    int rightResult = query(rightTreeIndex, mid + 1, r, mid + 1, queryR);
    return leftResult + rightResult;
}

该方法的复杂度为：O(logN)。

五：修改线段树

代码链接🔗

修改线段树的思想也非常简单，这里就不再赘述了。

public void update(int index, E e) {
    if (index < 0 || index >= data.length)
        throw new IllegalArgumentException("Index is illegal");
    data[index] = e;
    update(0, 0, data.length - 1, index, e);
}
/**
 * 在以 treeIndex 为根节点的线段树中，更新 index 的值为 e
 *
 * @param treeIndex
 * @param l
 * @param r
 * @param index
 * @param e
 */
private void update(int treeIndex, int l, int r, int index, E e) {
    if (l == r) {
        // 当 l == r 说明，找到了线段树的叶子节点，该节点的值就是 data[index]，更新这个节点
        tree[treeIndex] = e;
        return;
    }
    int leftTreeIndex = getLeftChildIndex(treeIndex);
    int rightTreeIndex = getRightChildIndex(treeIndex);
    int mid = l + ((r - l) >> 1);
    if (index <= mid)
        update(leftTreeIndex, l, mid, index, e);
    else
        update(rightTreeIndex, mid + 1, r, index, e);
    tree[treeIndex] = merger.merge(tree[leftTreeIndex], tree[rightTreeIndex]);
}

六：自下而上创建线段树

代码链接🔗

上面我们使用递归的方式构建了一棵线段树。

除了上面这种构建线段树的方法，我们还可以使用“自下而上”的思想，构建一棵线段树。

所谓的“自下而上”的含义为：先构建线段树的叶子节点。

我们假定，该线段树为一棵满二叉树。这样，数组当中的所有元素恰好可以成为满二叉树的叶子节点，满二叉树节点的总数为 2n - 1 个，叶子节点为 n 个，我们将开辟 2n 的额外空间来存储整个线段树。叶子节点的索引范围为 [n,2n - 1]，这样一来，线段树的根节点的索引就是 1。

假设，我们有数组 A = [2,3,5,-1,6,8,7,0,-2]，线段树表示为区间和的信息。我们构建线段树的过程如图所示：

更新线段树

代码链接🔗

当我们更新数组中某个索引 i 处的元素时，我们也使用自下而上的方式，首先更新线段树的叶子节点，然后一路向上，直到根节点，并用其子节点的值的总和来更新每一个父节点的值。

代码如下：

/**
 * 更改 data 数组 index 处的元素为 val
 *
 * @param index
 * @param val
 */
public void update(int index, E val) {
    data[index] = val;
    index += data.length;
    tree[index] = val;
    while (index > 1) {
        int leftIndex = index;
        int rightIndex = index;
        if (index % 2 == 0) {
            rightIndex = index + 1;
        } else {
            leftIndex = index - 1;
        }
        tree[index / 2] = merger.merge(tree[leftIndex], tree[rightIndex]);
        index /= 2;
    }
}

该操作的时间复杂度为：O(logN)。

区域查询

代码链接🔗

依旧是使用自下而上的方式，我们对 [l,r] 这个区域范围进行查询。算法的循环不变量为：l <= r，通过子节点寻找父节点的方式是除 2，每次迭代的范围 [l,r] 都会约缩小一半，直至 logN 次后，两个边界相遇，所以该算法的时间复杂度为 O(logN)。

代码如下：

/**
 * 查询区间 [l...r] 的信息
 *
 * @param l
 * @param r
 * @return
 */
public E query(int l, int r) {
    if (l < 0 || l >= data.length
            || r < 0 || r >= data.length
            || l > r) {
        throw new IllegalArgumentException("Index is illegal");
    }
    l += data.length;
    r += data.length;
    E res = null;
    while (l <= r) {
        if (l % 2 == 1) {
            if (res == null) {
                res = tree[l];
            } else {
                res = merger.merge(res, tree[l]);
            }
            l++;
        }
        if (r % 2 == 0) {
            if (res == null) {
                res = tree[r];
            } else {
                res = merger.merge(res, tree[r]);
            }
            r--;
        }
        l /= 2;
        r /= 2;
    }
    return res;
}

六：线段树的更多操作

待完成…