题目

设计一个找到数据流中第K大元素的类（class）。注意是排序后的第K大元素，不是第K个不同的元素。

你的 KthLargest 类需要一个同时接收整数 k 和整数数组 nums 的构造器，它包含数据流中的初始元素。每次调用 KthLargest.add，返回当前数据流中第K大的元素。

示例:

int k = 3;
int[] arr = [4,5,8,2];
KthLargest kthLargest = new KthLargest(3, arr);
kthLargest.add(3);   // returns 4
kthLargest.add(5);   // returns 5
kthLargest.add(10);  // returns 5
kthLargest.add(9);   // returns 8
kthLargest.add(4);   // returns 8

说明:

你可以假设 nums 的长度 ≥ k-1 且 k ≥ 1。

方案一（二叉搜索树）

class Node:
    def __init__(self, val):
        self.val = val
        self.right = None
        self.left = None
        self.count = 1 # 相同val节点出现的次数
        self.cnt = 1

class KthLargest:

    def __init__(self, k: int, nums: [int]):
        self.root = None
        self.k = k
        # 对 k == 1 进行特殊处理（否则leetcode会超时）
        if k == 1:
            self.max = max(nums) if nums else float('-inf')
        else:
            for num in nums:
                self._insertBST(num)

    def _insertBST(self, val):
        if not self.root:
            self.root = Node(val)
        else:
            node = self.root
            while node:
                node.cnt += 1
                if node.val > val:
                    if node.left:
                        node = node.left
                    else:
                        node.left = Node(val)
                        break
                elif node.val < val:
                    if node.right:
                        node = node.right
                    else:
                        node.right = Node(val)
                        break
                else:
                    node.count += 1
                    break

    def add(self, val: int) -> int:
        if self.k == 1:
            if val > self.max:
                self.max = val
            return self.max
        else:
            self._insertBST(val)
            return self._getKLargest(self.root, self.k)

    def _getKLargest(self, root,  k):
        if not root:
            return None
        if not root.right:
            if root.left and k - root.count > 0:
                return self._getKLargest(root.left, k - root.count)
            else:
                return root.val
        if root.right.cnt == k - 1:
            return root.val
        elif root.right.cnt > k - 1:
            return self._getKLargest(root.right, k)
        elif not root.left or k - root.count - root.right.cnt <= 0:
            return root.val
        else:
            return self._getKLargest(root.left, k - root.count - root.right.cnt)

参考下述链接的实现：

上述 _getKLargest 逻辑不好理解

https://leetcode-cn.com/problems/kth-largest-element-in-a-stream/solution/er-cha-sou-suo-shu-fa-by-avatarqing/

方案二（最小堆）

from heapq import heappush, heappop
class KthLargest:

    def __init__(self, k: int, nums: List[int]):
        self.nums = nums
        self.k = k
        heapq.heapify(self.nums)
        while len(self.nums) > k:
            heapq.heappop(self.nums)

    def add(self, val: int) -> int:
        if len(self.nums) < self.k:
            heapq.heappush(self.nums, val)
        elif val > self.nums[0]:
            heapq.heapreplace(self.nums, val)
        return self.nums[0]

方案三（数组）

思考，根据题目要求只需要保留 k 个较大的数即可，此时时间复杂度为 $O(k)$ （不考虑数组移位时间复杂度）

这是由最小堆退化而来的方法，不使用堆这个特殊的结构，直接使用数组

class KthLargest:

    def __init__(self, k: int, nums: List[int]):
        self.k = k
        nums.sort(reverse=True)
        self.nums = nums[:k]

    def add(self, val: int) -> int:
        if len(self.nums) == self.k and self.nums[-1] > val:
            pass
        else:
            self.nums.append(val)
            self.nums.sort(reverse=True)
            self.nums = self.nums[:self.k]

        return self.nums[-1]

因为 add 只需要执行插入操作以及获取最小的元素，所以使用链表性能会更好

原文

https://leetcode-cn.com/explore/learn/card/introduction-to-data-structure-binary-search-tree/66/conclusion/183/

算法（leetcode）

Kth Largest Element in a Stream

题目

方案一（二叉搜索树）

方案二（最小堆）

方案三（数组）

原文