基本思想:
堆排序是一种树形选择排序,是对直接选择排序的有效改进。
具有n个元素的序列 (h1,h2,…,hn),当且仅当满足(hi>=h2i,hi>=2i+1)或(hi<=h2i,hi<=2i+1) (i=1,2,…,n/2)时称之为堆。在这里只讨论满足前者条件的堆。由堆的定义可以看出,堆顶元素(即第一个元素)必为最大项(大顶堆)。完全二 叉树可以很直观地表示堆的结构。堆顶为根,其它为左子树、右子树。 初始时把要排序的数的序列看作是一棵顺序存储的二叉树,调整它们的存储序,使之成为一个堆,这时堆的根节点的数最大。然后将根节点与堆的最后一个节点交换。然后对前面(n-1)个数重新调整使之成为堆。依此类推,直到只有两个节点的堆,并对 它们作交换,最后得到有n个节点的有序序列。从算法描述来看,堆排序需要两个过程,一是建立堆,二是堆顶与堆的最后一个元素交换位置。所以堆排序有两个函数组成。一是建堆的渗透函数,二是反复调用渗透函数实现排序的函数。
代码实现:
package com.sort;//不稳定import java.util.Arrays;public class HeapSort {public static void main(String[] args) {int[] a={49,38,65,97,76,13,27,49,78,34,12,64};int arrayLength=a.length;//循环建堆for(int i=0;i<arrayLength-1;i++){//建堆buildMaxHeap(a,arrayLength-1-i);//交换堆顶和最后一个元素swap(a,0,arrayLength-1-i);System.out.println(Arrays.toString(a));}}//对data数组从0到lastIndex建大顶堆public static void buildMaxHeap(int[] data, int lastIndex){//从lastIndex处节点(最后一个节点)的父节点开始for(int i=(lastIndex-1)/2;i>=0;i--){//k保存正在判断的节点int k=i;//如果当前k节点的子节点存在while(k*2+1<=lastIndex){//k节点的左子节点的索引int biggerIndex=2*k+1;//如果biggerIndex小于lastIndex,即biggerIndex+1代表的k节点的右子节点存在if(biggerIndex<lastIndex){//如果右子节点的值较大if(data[biggerIndex]<data[biggerIndex+1]){//biggerIndex总是记录较大子节点的索引biggerIndex++;}}//如果k节点的值小于其较大的子节点的值if(data[k]<data[biggerIndex]){//交换他们swap(data,k,biggerIndex);//将biggerIndex赋予k,开始while循环的下一次循环,重新保证k节点的值大于其左右子节点的值k=biggerIndex;}else{break;}}}}//交换private static void swap(int[] data, int i, int j) {int tmp=data[i];data[i]=data[j];data[j]=tmp;}}
总结:
堆排序也是一种不稳定的排序算法。
堆排序优于简单选择排序的原因:
直接选择排序中,为了从R[1..n]中选出关键字最小的记录,必须进行n-1次比较,然后在R[2..n]中选出关键字最小的记录,又需要做n-2次比较。事实上,后面的n-2次比较中,有许多比较可能在前面的n-1次比较中已经做过,但由于前一趟排序时未保留这些比较结果,所以后一趟排序时又重复执行了这些比较操作。
堆排序可通过树形结构保存部分比较结果,可减少比较次数。
堆排序的最坏时间复杂度为O(nlogn)。堆序的平均性能较接近于最坏性能。由于建初始堆所需的比较次数较多,所以堆排序不适宜于记录数较少的文件。
