快速选择


用于求解 Kth Element 问题,也就是第 K 个元素的问题。

可以使用快速排序的 partition() 进行实现。需要先打乱数组,否则最坏情况下时间复杂度为 O(N)。


用于求解 TopK Elements 问题,也就是 K 个最小元素的问题。使用最小堆来实现 TopK 问题,最小堆使用大顶堆来实现,大顶堆的堆顶元素为当前堆的最大元素。实现过程:不断地往大顶堆中插入新元素,当堆中元素的数量大于 k 时,移除堆顶元素,也就是当前堆中最大的元素,剩下的元素都为当前添加过的元素中最小的 K 个元素。插入和移除堆顶元素的时间复杂度都为 logN。

堆也可以用于求解 Kth Element 问题,得到了大小为 K 的最小堆之后,因为使用了大顶堆来实现,因此堆顶元素就是第 K 大的元素。

快速选择也可以求解 TopK Elements 问题,因为找到 Kth Element 之后,再遍历一次数组,所有小于等于 Kth Element 的元素都是 TopK Elements。

可以看到,快速选择和堆排序都可以求解 Kth Element 和 TopK Elements 问题。

1. Kth Element

  1. Kth Largest Element in an Array (Medium)

Leetcode / 力扣

  1. Input: [3,2,1,5,6,4] and k = 2
  2. Output: 5

题目描述:找到倒数第 k 个的元素。

排序 :时间复杂度 O(NlogN),空间复杂度 O(1)

  1. public int findKthLargest(int[] nums, int k) {
  2. Arrays.sort(nums);
  3. return nums[nums.length - k];
  4. }

:时间复杂度 O(NlogK),空间复杂度 O(K)。

  1. public int findKthLargest(int[] nums, int k) {
  2. PriorityQueue<Integer> pq = new PriorityQueue<>(); // 小顶堆
  3. for (int val : nums) {
  4. pq.add(val);
  5. if (pq.size() > k) // 维护堆的大小为 K
  6. pq.poll();
  7. }
  8. return pq.peek();
  9. }

快速选择 :时间复杂度 O(N),空间复杂度 O(1)

  1. public int findKthLargest(int[] nums, int k) {
  2. k = nums.length - k;
  3. int l = 0, h = nums.length - 1;
  4. while (l < h) {
  5. int j = partition(nums, l, h);
  6. if (j == k) {
  7. break;
  8. } else if (j < k) {
  9. l = j + 1;
  10. } else {
  11. h = j - 1;
  12. }
  13. }
  14. return nums[k];
  15. }
  16. private int partition(int[] a, int l, int h) {
  17. int i = l, j = h + 1;
  18. while (true) {
  19. while (a[++i] < a[l] && i < h) ;
  20. while (a[--j] > a[l] && j > l) ;
  21. if (i >= j) {
  22. break;
  23. }
  24. swap(a, i, j);
  25. }
  26. swap(a, l, j);
  27. return j;
  28. }
  29. private void swap(int[] a, int i, int j) {
  30. int t = a[i];
  31. a[i] = a[j];
  32. a[j] = t;
  33. }

桶排序


1. 出现频率最多的 k 个元素

  1. Top K Frequent Elements (Medium)

Leetcode / 力扣

  1. Given [1,1,1,2,2,3] and k = 2, return [1,2].

设置若干个桶,每个桶存储出现频率相同的数。桶的下标表示数出现的频率,即第 i 个桶中存储的数出现的频率为 i。

把数都放到桶之后,从后向前遍历桶,最先得到的 k 个数就是出现频率最多的的 k 个数。

  1. public int[] topKFrequent(int[] nums, int k) {
  2. Map<Integer, Integer> frequencyForNum = new HashMap<>();
  3. for (int num : nums) {
  4. frequencyForNum.put(num, frequencyForNum.getOrDefault(num, 0) + 1);
  5. }
  6. List<Integer>[] buckets = new ArrayList[nums.length + 1];
  7. for (int key : frequencyForNum.keySet()) {
  8. int frequency = frequencyForNum.get(key);
  9. if (buckets[frequency] == null) {
  10. buckets[frequency] = new ArrayList<>();
  11. }
  12. buckets[frequency].add(key);
  13. }
  14. List<Integer> topK = new ArrayList<>();
  15. for (int i = buckets.length - 1; i >= 0 && topK.size() < k; i--) {
  16. if (buckets[i] == null) {
  17. continue;
  18. }
  19. if (buckets[i].size() <= (k - topK.size())) {
  20. topK.addAll(buckets[i]);
  21. } else {
  22. topK.addAll(buckets[i].subList(0, k - topK.size()));
  23. }
  24. }
  25. int[] res = new int[k];
  26. for (int i = 0; i < k; i++) {
  27. res[i] = topK.get(i);
  28. }
  29. return res;
  30. }

2. 按照字符出现次数对字符串排序

  1. Sort Characters By Frequency (Medium)

Leetcode / 力扣

  1. Input:
  2. "tree"
  3. Output:
  4. "eert"
  5. Explanation:
  6. 'e' appears twice while 'r' and 't' both appear once.
  7. So 'e' must appear before both 'r' and 't'. Therefore "eetr" is also a valid answer.
  1. public String frequencySort(String s) {
  2. Map<Character, Integer> frequencyForNum = new HashMap<>();
  3. for (char c : s.toCharArray())
  4. frequencyForNum.put(c, frequencyForNum.getOrDefault(c, 0) + 1);
  5. List<Character>[] frequencyBucket = new ArrayList[s.length() + 1];
  6. for (char c : frequencyForNum.keySet()) {
  7. int f = frequencyForNum.get(c);
  8. if (frequencyBucket[f] == null) {
  9. frequencyBucket[f] = new ArrayList<>();
  10. }
  11. frequencyBucket[f].add(c);
  12. }
  13. StringBuilder str = new StringBuilder();
  14. for (int i = frequencyBucket.length - 1; i >= 0; i--) {
  15. if (frequencyBucket[i] == null) {
  16. continue;
  17. }
  18. for (char c : frequencyBucket[i]) {
  19. for (int j = 0; j < i; j++) {
  20. str.append(c);
  21. }
  22. }
  23. }
  24. return str.toString();
  25. }

荷兰国旗问题


荷兰国旗包含三种颜色:红、白、蓝。

有三种颜色的球,算法的目标是将这三种球按颜色顺序正确地排列。它其实是三向切分快速排序的一种变种,在三向切分快速排序中,每次切分都将数组分成三个区间:小于切分元素、等于切分元素、大于切分元素,而该算法是将数组分成三个区间:等于红色、等于白色、等于蓝色。

Leetcode 题解 - 排序 - 图1

1. 按颜色进行排序

  1. Sort Colors (Medium)

Leetcode / 力扣

  1. Input: [2,0,2,1,1,0]
  2. Output: [0,0,1,1,2,2]

题目描述:只有 0/1/2 三种颜色。

  1. public void sortColors(int[] nums) {
  2. int zero = -1, one = 0, two = nums.length;
  3. while (one < two) {
  4. if (nums[one] == 0) {
  5. swap(nums, ++zero, one++);
  6. } else if (nums[one] == 2) {
  7. swap(nums, --two, one);
  8. } else {
  9. ++one;
  10. }
  11. }
  12. }
  13. private void swap(int[] nums, int i, int j) {
  14. int t = nums[i];
  15. nums[i] = nums[j];
  16. nums[j] = t;
  17. }