题目

设计一个找到数据流中第K大元素的类(class)。注意是排序后的第K大元素,不是第K个不同的元素。

你的 KthLargest 类需要一个同时接收整数 k 和整数数组 nums 的构造器,它包含数据流中的初始元素。每次调用 KthLargest.add,返回当前数据流中第K大的元素。

示例:

  1. int k = 3;
  2. int[] arr = [4,5,8,2];
  3. KthLargest kthLargest = new KthLargest(3, arr);
  4. kthLargest.add(3); // returns 4
  5. kthLargest.add(5); // returns 5
  6. kthLargest.add(10); // returns 5
  7. kthLargest.add(9); // returns 8
  8. kthLargest.add(4); // returns 8

说明:

  • 你可以假设 nums 的长度 ≥ k-1k ≥ 1

方案一(二叉搜索树)

class Node:
    def __init__(self, val):
        self.val = val
        self.right = None
        self.left = None
        self.count = 1 # 相同val节点出现的次数
        self.cnt = 1

class KthLargest:

    def __init__(self, k: int, nums: [int]):
        self.root = None
        self.k = k
        # 对 k == 1 进行特殊处理(否则leetcode会超时)
        if k == 1:
            self.max = max(nums) if nums else float('-inf')
        else:
            for num in nums:
                self._insertBST(num)

    def _insertBST(self, val):
        if not self.root:
            self.root = Node(val)
        else:
            node = self.root
            while node:
                node.cnt += 1
                if node.val > val:
                    if node.left:
                        node = node.left
                    else:
                        node.left = Node(val)
                        break
                elif node.val < val:
                    if node.right:
                        node = node.right
                    else:
                        node.right = Node(val)
                        break
                else:
                    node.count += 1
                    break

    def add(self, val: int) -> int:
        if self.k == 1:
            if val > self.max:
                self.max = val
            return self.max
        else:
            self._insertBST(val)
            return self._getKLargest(self.root, self.k)

    def _getKLargest(self, root,  k):
        if not root:
            return None
        if not root.right:
            if root.left and k - root.count > 0:
                return self._getKLargest(root.left, k - root.count)
            else:
                return root.val
        if root.right.cnt == k - 1:
            return root.val
        elif root.right.cnt > k - 1:
            return self._getKLargest(root.right, k)
        elif not root.left or k - root.count - root.right.cnt <= 0:
            return root.val
        else:
            return self._getKLargest(root.left, k - root.count - root.right.cnt)

参考下述链接的实现:

上述 _getKLargest 逻辑不好理解

https://leetcode-cn.com/problems/kth-largest-element-in-a-stream/solution/er-cha-sou-suo-shu-fa-by-avatarqing/

方案二(最小堆)

from heapq import heappush, heappop
class KthLargest:

    def __init__(self, k: int, nums: List[int]):
        self.nums = nums
        self.k = k
        heapq.heapify(self.nums)
        while len(self.nums) > k:
            heapq.heappop(self.nums)

    def add(self, val: int) -> int:
        if len(self.nums) < self.k:
            heapq.heappush(self.nums, val)
        elif val > self.nums[0]:
            heapq.heapreplace(self.nums, val)
        return self.nums[0]

方案三(数组)

  • 思考,根据题目要求只需要保留 k 个较大的数即可,此时时间复杂度为 $O(k)$(不考虑数组移位时间复杂度)

这是由 最小堆 退化而来的方法,不使用堆这个特殊的结构,直接使用数组

class KthLargest:

    def __init__(self, k: int, nums: List[int]):
        self.k = k
        nums.sort(reverse=True)
        self.nums = nums[:k]

    def add(self, val: int) -> int:
        if len(self.nums) == self.k and self.nums[-1] > val:
            pass
        else:
            self.nums.append(val)
            self.nums.sort(reverse=True)
            self.nums = self.nums[:self.k]

        return self.nums[-1]
  • 因为 add 只需要执行插入操作以及获取最小的元素,所以使用链表性能会更好

原文

https://leetcode-cn.com/explore/learn/card/introduction-to-data-structure-binary-search-tree/66/conclusion/183/