题目
设计一个找到数据流中第K大元素的类(class)。注意是排序后的第K大元素,不是第K个不同的元素。
你的 KthLargest
类需要一个同时接收整数 k
和整数数组 nums
的构造器,它包含数据流中的初始元素。每次调用 KthLargest.add
,返回当前数据流中第K大的元素。
示例:
int k = 3;
int[] arr = [4,5,8,2];
KthLargest kthLargest = new KthLargest(3, arr);
kthLargest.add(3); // returns 4
kthLargest.add(5); // returns 5
kthLargest.add(10); // returns 5
kthLargest.add(9); // returns 8
kthLargest.add(4); // returns 8
说明:
- 你可以假设
nums
的长度≥ k-1
且k ≥ 1
。
方案一(二叉搜索树)
class Node:
def __init__(self, val):
self.val = val
self.right = None
self.left = None
self.count = 1 # 相同val节点出现的次数
self.cnt = 1
class KthLargest:
def __init__(self, k: int, nums: [int]):
self.root = None
self.k = k
# 对 k == 1 进行特殊处理(否则leetcode会超时)
if k == 1:
self.max = max(nums) if nums else float('-inf')
else:
for num in nums:
self._insertBST(num)
def _insertBST(self, val):
if not self.root:
self.root = Node(val)
else:
node = self.root
while node:
node.cnt += 1
if node.val > val:
if node.left:
node = node.left
else:
node.left = Node(val)
break
elif node.val < val:
if node.right:
node = node.right
else:
node.right = Node(val)
break
else:
node.count += 1
break
def add(self, val: int) -> int:
if self.k == 1:
if val > self.max:
self.max = val
return self.max
else:
self._insertBST(val)
return self._getKLargest(self.root, self.k)
def _getKLargest(self, root, k):
if not root:
return None
if not root.right:
if root.left and k - root.count > 0:
return self._getKLargest(root.left, k - root.count)
else:
return root.val
if root.right.cnt == k - 1:
return root.val
elif root.right.cnt > k - 1:
return self._getKLargest(root.right, k)
elif not root.left or k - root.count - root.right.cnt <= 0:
return root.val
else:
return self._getKLargest(root.left, k - root.count - root.right.cnt)
参考下述链接的实现:
上述
_getKLargest
逻辑不好理解
https://leetcode-cn.com/problems/kth-largest-element-in-a-stream/solution/er-cha-sou-suo-shu-fa-by-avatarqing/
方案二(最小堆)
from heapq import heappush, heappop
class KthLargest:
def __init__(self, k: int, nums: List[int]):
self.nums = nums
self.k = k
heapq.heapify(self.nums)
while len(self.nums) > k:
heapq.heappop(self.nums)
def add(self, val: int) -> int:
if len(self.nums) < self.k:
heapq.heappush(self.nums, val)
elif val > self.nums[0]:
heapq.heapreplace(self.nums, val)
return self.nums[0]
方案三(数组)
- 思考,根据题目要求只需要保留 k 个较大的数即可,此时时间复杂度为
$O(k)$
(不考虑数组移位时间复杂度)
这是由 最小堆 退化而来的方法,不使用堆这个特殊的结构,直接使用数组
class KthLargest:
def __init__(self, k: int, nums: List[int]):
self.k = k
nums.sort(reverse=True)
self.nums = nums[:k]
def add(self, val: int) -> int:
if len(self.nums) == self.k and self.nums[-1] > val:
pass
else:
self.nums.append(val)
self.nums.sort(reverse=True)
self.nums = self.nums[:self.k]
return self.nums[-1]
- 因为
add
只需要执行插入操作以及获取最小的元素,所以使用链表性能会更好