之前看了选择和插入排序,这两个算法是的时间复杂度均为O(n^2),而随着问题规模n的增大,插入和选择排序都比较慢。

    归并排序时的时间复杂度为O(nlgn) 其主要思想是分治法(divide and conquer),分就是要将n个元素的序列划分为两个序列,再将两个序列划分为4个序列,

    直到每个序列只有一个元素,最后,再将两个有序序列归并成一个有序的序列。

    例如两个序列:

    归并排序详解 - 图1

    要归并成一个有序的序列,按照我们常规的方法,我们每次从两个列表开头元素选取较小的一个,直到某一个列表到达底部,再将另一个剩下部分顺序取出。其实如果将每个元素最后添加一个最大值,则无需判断是否达到列表尽头。

    归并排序详解 - 图2

    代码如下:merge函数的功能为将A中[low,mid],[mid+1,high]归并成一个有序的片段。

    1. template<class T> void merge(T A[],int low,int mid,int high)
    2. {
    3. //low to mid as the left array mid+1 to high as the right array
    4. int llen = mid-low+2;
    5. int rlen = high-mid+1;
    6. T *left = (T*)new T[llen];
    7. T *right = (T*)new T[rlen];
    8. //copy the low to mid to the temp array left
    9. for (int i=0;i<llen-1;i++)
    10. {
    11. left[i] = A[low+i];
    12. }
    13. for (i=0;i<rlen-1;i++)
    14. {
    15. right[i] = A[mid+1+i];
    16. }
    17. //set the sentinel
    18. left[llen-1] = numeric_limits<T>::max();
    19. right[rlen-1]= numeric_limits<T>::max();
    20. //merge the two array and copy to A[low,high];
    21. int j = 0;
    22. int k = 0;
    23. for (i = low; i < high+1 ;i++)
    24. {
    25. if (left[j] < right[k])
    26. {
    27. A[i] = left[j];
    28. j++;
    29. }
    30. else
    31. {
    32. A[i] = right[k];
    33. k++;
    34. }
    35. } delete [] left; delete [] right;
    36. }

    归并排序就是多次调用merge

    1. template<class T> merge_sort(T A[],int low,int high)
    2. {
    3. int mid = (low+high)/2;
    4. if (low < high)
    5. {
    6. merge_sort(A,low,mid);
    7. merge_sort(A,mid+1,high);
    8. merge(A,low,mid,high);
    9. }
    10. }

    这是一个递归算法,这个算法的理解其实可以借助下面这个图:

    归并排序详解 - 图3

    对于原始的数组2,1,3,8,5,7,6,4,10,在整个过程执行的是顺序是途中红色编号1-20。虽然我们描述中说的是程序先分解,再归并,但实际过程是一边分解一边归并,前半部分分先排好序,后半部分再拍好,最后整个归并为一个完整的序列,途中的merge过程它所在层的两个序列的merge过程:下图展示了每个merge过程对作用于数组的哪部分(红色)。

    归并排序详解 - 图4

    整个过程就像一个动态的树,执行顺序就是对树的先序遍历顺序。

    最后实验验证,对10000个倒序的数组进行排序,直接插入排序需1024ms,二归并排序只需20ms。