认识“分治”思想

本节我们要学习的两个排序算法都是对“分治”思想的应用。
“分治”,分而治之。其思想就是将一个大问题分解为若干个子问题,针对子问题分别求解后,再将子问题的解整合为大问题的解
利用分治思想解决问题,我们一般分三步走:

  • 分解子问题
  • 求解每个子问题
  • 合并子问题的解,得出大问题的解

下面我们一起来看看分治思想是如何帮助我们提升排序算法效率的。

归并排序

思路分析

归并排序是对分治思想的典型应用,它按照如下的思路对分治思想“三步走”的框架进行了填充:

  • 分解子问题:将需要被排序的数组从中间分割为两半,然后再将分割出来的每个子数组各分割为两半,重复以上操作,直到单个子数组只有一个元素为止。
  • 求解每个子问题:从粒度最小的子数组开始,两两合并、确保每次合并出来的数组都是有序的。(这里的“子问题”指的就是对每个子数组进行排序)。
  • 合并子问题的解,得出大问题的解:当数组被合并至原有的规模时,就得到了一个完全排序的数组

    真实排序过程演示

    下面我们基于归并排序的思路,尝试对以下数组进行排序:

    1. [8, 7, 6, 5, 4, 3, 2, 1]

    首先重复地分割数组,整个分割过程如下
    首次分割,将数组整个对半分:

    1. [8, 7, 6, 5,| 4, 3, 2, 1]

    二次分割,将分割出的左右两个子数组各自对半分:

    1. [8, 7,| 6, 5,| 4, 3,| 2, 1]

    三次分割,四个子数组各自对半分后,每个子数组内都只有一个元素了:

    1. [8,| 7,| 6,| 5,| 4,| 3,| 2,| 1]

    接下来开始尝试解决每个子问题。将规模为1的子数组两两合并为规模为2的子数组,合并时确保有序,我们会得到这样的结果:

    1. [7, 8,| 5, 6,| 3, 4,| 1, 2]

    继续将规模为2的按照有序原则合并为规模为4的子数组:

    1. [5, 6, 7, 8,| 1, 2, 3, 4]

    最后将规模为4的子数组合并为规模为8的数组:

    1. [1, 2, 3, 4, 5, 6, 7, 8]

    整个数组就完全有序了。

    编码实现

    通过上面的讲解,我们可以总结出归并排序中的两个主要动作:

  • 分割

  • 合并

这两个动作是紧密关联的,分割是将大数组反复分解为一个一个的原子项,合并是将原子项反复地组装回原有的大数组。整个过程符合两个特征:

  1. 重复(令人想到递归或迭代)
  2. 有去有回(令人想到回溯,进而明确递归这条路)

因此,归并排序在实现上依托的就是递归思想。
除此之外,这里还涉及到另一个小小的知识点——两个有序数组的合并。合并有序数组是咱们在第 7 节讲过的一道真题,涉及到双指针法。此处强烈建议印象模糊的同学回头复习一下完整的解题思路。

编码实现

  1. function mergeSort(arr) {
  2. const len = arr.length
  3. // 处理边界情况
  4. if(len <= 1) {
  5. return arr
  6. }
  7. // 计算分割点
  8. const mid = Math.floor(len / 2)
  9. // 递归分割左子数组,然后合并为有序数组
  10. const leftArr = mergeSort(arr.slice(0, mid))
  11. // 递归分割右子数组,然后合并为有序数组
  12. const rightArr = mergeSort(arr.slice(mid,len))
  13. // 合并左右两个有序数组
  14. arr = mergeArr(leftArr, rightArr)
  15. // 返回合并后的结果
  16. return arr
  17. }
  18. function mergeArr(arr1, arr2) {
  19. // 初始化两个指针,分别指向 arr1 和 arr2
  20. let i = 0, j = 0
  21. // 初始化结果数组
  22. const res = []
  23. // 缓存arr1的长度
  24. const len1 = arr1.length
  25. // 缓存arr2的长度
  26. const len2 = arr2.length
  27. // 合并两个子数组
  28. while(i < len1 && j < len2) {
  29. if(arr1[i] < arr2[j]) {
  30. res.push(arr1[i])
  31. i++
  32. } else {
  33. res.push(arr2[j])
  34. j++
  35. }
  36. }
  37. // 若其中一个子数组首先被合并完全,则直接拼接另一个子数组的剩余部分
  38. if(i<len1) {
  39. return res.concat(arr1.slice(i))
  40. } else {
  41. return res.concat(arr2.slice(j))
  42. }
  43. }

编码复盘——归并排序的时间复杂度分析

归并排序的时间复杂度的分析,同样是基于分治法。

基于数学计算的分析

我们假设规模为 n 的数组对应的排序的时间复杂度是一个关于 n 的函数 F(n)。那么它和自己的两个子数组之间就有如下关系:

  1. F(n) = F(n/2) + F(n/2) + 合并两个数组的时间

合并两个数组的过程一共要对 n 个元素进行一轮循环,因此时间复杂度可以目测出来是 O(n),代入上面公式:

  1. F(n) = F(n/2) + F(n/2) + O(n) = 2^1*T(n/2)+2^0*O(n)

继续细分,两个子数组被划分为四个子数组,仍然遵循上面公式所描述的关系。代入 n/4 后可以得到四个子数组和大数组之间的关系:

  1. F(n/2) = 2*F(n/4)+O(n)
  2. F(n) = 2*(2*F(n/4)+O(n))+O(n) = 2^2*F(n/4)+2^1*O(n)

这样不断划分下去,直到每个序列里只有一个数位置。对于规模为 n 的数组来说,需要划分的次数为 log(n),用 log(n) 替换掉上述公式中的2的次数,我们就可以得到归并排序的时间复杂度:

  1. F(n) = nF(1) + O(nlog(n)) = O(nlog(n))

综上所述, 归并排序的时间复杂度是 O(nlog(n))

基于逻辑的分析

如果上面的数学公式让你感到不友好,那么我们通过简单的逻辑估算,也可以得出归并排序的时间复杂度:
逻辑估算的核心思想是“抓主要矛盾”。我们可以回顾一下归并排序的代码:

  1. function mergeSort(arr) {
  2. const len = arr.length
  3. // 处理边界情况
  4. if(len <= 1) {
  5. return arr
  6. }
  7. // 计算分割点
  8. const mid = Math.floor(len / 2)
  9. // 递归分割左子数组,然后合并为有序数组
  10. const leftArr = mergeSort(arr.slice(0, mid))
  11. // 递归分割右子数组,然后合并为有序数组
  12. const rightArr = mergeSort(arr.slice(mid,len))
  13. // 合并左右两个有序数组
  14. arr = mergeArr(leftArr, rightArr)
  15. // 返回合并后的结果
  16. return arr
  17. }
  18. function mergeArr(arr1, arr2) {
  19. // 初始化两个指针,分别指向 arr1 和 arr2
  20. let i = 0, j = 0
  21. // 初始化结果数组
  22. const res = []
  23. // 缓存arr1的长度
  24. const len1 = arr1.length
  25. // 缓存arr2的长度
  26. const len2 = arr2.length
  27. // 合并两个子数组
  28. while(i < len1 && j < len2) {
  29. if(arr1[i] < arr2[j]) {
  30. res.push(arr1[i])
  31. i++
  32. } else {
  33. res.push(arr2[j])
  34. j++
  35. }
  36. }
  37. // 若其中一个子数组首先被合并完全,则直接拼接另一个子数组的剩余部分
  38. if(i<len1) {
  39. return res.concat(arr1.slice(i))
  40. } else {
  41. return res.concat(arr2.slice(j))
  42. }
  43. }

我们把每一次切分+归并看做是一轮。对于规模为 n 的数组来说,需要切分 log(n) 次,因此就有 log(n) 轮。
每一轮中,切分动作都是小事情,只需要固定的几步:

  1. // 计算分割点
  2. const mid = Math.floor(len / 2)
  3. // 递归分割左子数组,然后合并为有序数组
  4. const leftArr = mergeSort(arr.slice(0, mid))
  5. // 递归分割右子数组,然后合并为有序数组
  6. const rightArr = mergeSort(arr.slice(mid,len))

因此单次切分对应的是常数级别的时间复杂度 O(1)。
再看合并,单次合并的时间复杂度为 O(n)。O(n) 和 O(1) 完全不在一个复杂度量级上,因此本着“抓主要矛盾”的原则,我们可以认为:决定归并排序时间复杂度的操作就是合并操作。
log(n) 轮对应 log(n) 次合并操作,因此归并排序的时间复杂度就是 O(nlog(n))

  1. 以上两种时间复杂度的计算思路,大家理解其中一种即可,不必死磕。

快速排序

快速排序在基本思想上和归并排序是一致的,仍然坚持“分而治之”的原则不动摇。区别在于,快速排序并不会把真的数组分割开来再合并到一个新数组中去,而是直接在原有的数组内部进行排序。

思路分析

快速排序会将原始的数组筛选成较小和较大的两个子数组,然后递归地排序两个子数组。
这个描述对初学者来说可能会比较抽象,我们直接通过真实排序的过程来理解它:

真实排序过程演示

首先要做的事情就选取一个基准值。基准值的选择有很多方式,这里我们选取数组中间的值:

  1. [5, 1, 3, 6, 2, 0, 7]
  2. 基准

左右指针分别指向数组的两端。接下来我们要做的,就是先移动左指针,直到找到一个不小于基准值的值为止;然后再移动右指针,直到找到一个不大于基准值的值为止。
首先我们来看左指针,5比6小,故左指针右移一位:

  1. [5, 1, 3, 6, 2, 0, 7]
  2. 基准

继续对比,1比6小,继续右移左指针:

  1. [5, 1, 3, 6, 2, 0, 7]
  2. 基准

继续对比,3比6小,继续右移左指针,左指针最终指向了基准值:

  1. [5, 1, 3, 6, 2, 0, 7]
  2. 基准

此时由于 6===6,左指针停止移动。开始看右指针:
右指针指向7,7>6,故左移右指针:

  1. [5, 1, 3, 6, 2, 0, 7]
  2. 基准

发现 0 比 6 小,停下来,交换 6 和 0,同时两个指针共同向中间走一步:

  1. [5, 1, 3, 0, 2, 6, 7]
  2. 基准

此时 2 比 6 小,故右指针不动,左指针继续前进:

  1. [5, 1, 3, 0, 2, 6, 7]
  2. 基准
  3. right
  4. left

此时右指针所指的值不大于 6,左指针所指的值不小于 6,故两个指针都不再移动。此时我们会发现,对于左指针所指的数字来说,它左边的所有数字都比它小,右边的所有数字都比它大(这里注意也可能存在相等的情况)。由此我们就能够以左指针为轴心,划分出一左一右、一小一大两个子数组:

  1. [5, 1, 3, 0, 2]
  2. [6, 7]

针对两个子数组,重复执行以上操作,直到数组完全排序为止。这就是快速排序的整个过程。

编码实现

  1. // 快速排序入口
  2. function quickSort(arr, left = 0, right = arr.length - 1) {
  3. // 定义递归边界,若数组只有一个元素,则没有排序必要
  4. if(arr.length > 1) {
  5. // lineIndex表示下一次划分左右子数组的索引位
  6. const lineIndex = partition(arr, left, right)
  7. // 如果左边子数组的长度不小于1,则递归快排这个子数组
  8. if(left < lineIndex-1) {
  9. // 左子数组以 lineIndex-1 为右边界
  10. quickSort(arr, left, lineIndex-1)
  11. }
  12. // 如果右边子数组的长度不小于1,则递归快排这个子数组
  13. if(lineIndex<right) {
  14. // 右子数组以 lineIndex 为左边界
  15. quickSort(arr, lineIndex, right)
  16. }
  17. }
  18. return arr
  19. }
  20. // 以基准值为轴心,划分左右子数组的过程
  21. function partition(arr, left, right) {
  22. // 基准值默认取中间位置的元素
  23. let pivotValue = arr[Math.floor(left + (right-left)/2)]
  24. // 初始化左右指针
  25. let i = left
  26. let j = right
  27. // 当左右指针不越界时,循环执行以下逻辑
  28. while(i<=j) {
  29. // 左指针所指元素若小于基准值,则右移左指针
  30. while(arr[i] < pivotValue) {
  31. i++
  32. }
  33. // 右指针所指元素大于基准值,则左移右指针
  34. while(arr[j] > pivotValue) {
  35. j--
  36. }
  37. // 若i<=j,则意味着基准值左边存在较大元素或右边存在较小元素,交换两个元素确保左右两侧有序
  38. if(i<=j) {
  39. swap(arr, i, j)
  40. i++
  41. j--
  42. }
  43. }
  44. // 返回左指针索引作为下一次划分左右子数组的依据
  45. return i
  46. }
  47. // 快速排序中使用 swap 的地方比较多,我们提取成一个独立的函数
  48. function swap(arr, i, j) {
  49. [arr[i], arr[j]] = [arr[j], arr[i]]
  50. }

编码复盘——快速排序的时间复杂度分析

快速排序的时间复杂度的好坏,是由基准值来决定的。

  • 最好时间复杂度:它对应的是这种情况——我们每次选择基准值,都刚好是当前子数组的中间数。这时,可以确保每一次分割都能将数组分为两半,进而只需要递归 log(n) 次。这时,快速排序的时间复杂度分析思路和归并排序相似,最后结果也是 O(nlog(n))
  • 最坏时间复杂度:每次划分取到的都是当前数组中的最大值/最小值。大家可以尝试把这种情况代入快排的思路中,你会发现此时快排已经退化为了冒泡排序,对应的时间复杂度是 O(n^2)
  • 平均时间复杂度: O(nlog(n))

    小结

    经过两节的学习,大家已经掌握了前端算法面试中最常考、最关键的5种排序算法。对于已经学过的这些知识,希望大家课下多消化多反思,以“默写”为目标去反复熟悉每一个算法。
    排序算法的学习,对于培养大家的时间效率敏感度、提升算法优化思维等方面是大有裨益的。在整个算法知识体系中,还有一些虽然不常考察,但同样有趣的排序算法,比如基数排序、桶排序、堆排序等等,在这里推荐学有余力、时间充裕的同学课下多读多看,在排序算法这个专题下更进一步。