11.1 堆排序

11.1.1 堆排序基本介绍

1.堆的时间复杂度

堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复 杂度均为O(nlogn),它也是不稳定排序

2.堆的定义

堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆, 注意: 没有
要求结点的左孩子的值和右孩子的值的大小关系。 每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆

3. 大顶堆举例说明

java数据结构 第11章--树结构实际应用 - 图1

4. 小顶堆举例说明

java数据结构 第11章--树结构实际应用 - 图2

5. 使用场景

一般升序采用大顶堆,降序采用小顶堆

11.1.2 堆排序基本思想

堆排序的基本思想是:

1) 将待排序序列构造成一个大顶堆
2) 此时,整个序列的最大值就是堆顶的根节点。
3) 将其与末尾元素进行交换,此时末尾就为最大值。
4) 然后将剩余n-1 个元素重新构造成一个堆,这样会得到n 个元素的次小值。如此反复执行,便能得到一个有序
序列了。
可以看到在构建大顶堆的过程中,元素的个数逐渐减少,最后就得到一个有序序列了.

11.1.3 堆排序步骤图解

1.说明

要求 给你一个数组{4,6,8,5,9} , 要求使用堆排序法,将数组升序排序。

2.步骤一:构造初始堆

将给定无序序列构造成一个大顶堆(一般升序采用大顶堆,降序采用小顶堆)。 原始的数组[4, 6, 8, 5, 9]
1) .假设给定无序序列结构如下
java数据结构 第11章--树结构实际应用 - 图3
2) .此时我们从最后一个非叶子结点开始(叶结点自然不用调整,第一个非叶子结点
arr.length/2-1=5/2-1=1,也就是下面的6 结点),从左至右,从下至上进行调整。
3) .
java数据结构 第11章--树结构实际应用 - 图4
3) .找到第二个非叶节点4,由于[4,9,8]中9 元素最大,4 和9 交换。
java数据结构 第11章--树结构实际应用 - 图5
4) 这时,交换导致了子根[4,5,6]结构混乱,继续调整,[4,5,6]中6 最大,交换4 和6。 此时,我们就将一个无序序列构造成了一个大顶堆。
java数据结构 第11章--树结构实际应用 - 图6

此时,我们就将一个无序序列构造成了一个大顶堆。

3.步骤二:将堆顶元素与末尾元素进行交换,使末尾元素最大。 然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。
1) .将堆顶元素9 和末尾元素4 进行交换
java数据结构 第11章--树结构实际应用 - 图7

2) .重新调整结构,使其继续满足堆定义
java数据结构 第11章--树结构实际应用 - 图8
3) .再将堆顶元素8 与末尾元素5 进行交换,得到第二大元素8.
java数据结构 第11章--树结构实际应用 - 图9
4) 后续过程,继续进行调整,交换,如此反复进行,最终使得整个序列有序
java数据结构 第11章--树结构实际应用 - 图10

4.再简单总结下堆排序的基本思路:

1).将无序序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆;
2).将堆顶元素与末尾元素交换,将最大元素”沉”到数组末端;
3).重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,
直到整个序列有序。

11.1.4 堆排序代码实现

1.要求:

给你一个数组{4,6,8,5,9} , 要求使用堆排序法,将数组升序排序。

2.说明:

1) 堆排序不是很好理解,老师通过Debug 帮助大家理解堆排序
2) 堆排序的速度非常快,在我的机器上8 百万数据3 秒左右。O(nlogn)

3.代码实现

思路:
java数据结构 第11章--树结构实际应用 - 图11

  1. package tree;
  2. import java.text.SimpleDateFormat;
  3. import java.util.Arrays;
  4. import java.util.Date;
  5. public class HeapSort {
  6. public static void main(String[] args) {
  7. //要求将数组进行升序排序
  8. //int arr[] = {4, 6, 8, 5, 9};
  9. // 创建要给80000 个的随机的数组
  10. int[] arr = new int[8000000];
  11. for (int i = 0; i < 8000000; i++) {
  12. arr[i] = (int) (Math.random() * 8000000); // 生成一个[0, 8000000) 数
  13. }
  14. System.out.println("排序前");
  15. Date data1 = new Date();
  16. SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
  17. String date1Str = simpleDateFormat.format(data1);
  18. System.out.println("排序前的时间是=" + date1Str);
  19. heapSort(arr);
  20. Date data2 = new Date();
  21. String date2Str = simpleDateFormat.format(data2);
  22. System.out.println("排序前的时间是=" + date2Str);
  23. //System.out.println("排序后=" + Arrays.toString(arr));
  24. }
  25. //编写一个堆排序的方法
  26. public static void heapSort(int arr[]) {
  27. int temp = 0;
  28. System.out.println("堆排序!!");
  29. // //分步完成
  30. // adjustHeap(arr, 1, arr.length);
  31. // System.out.println("第一次" + Arrays.toString(arr)); // 4, 9, 8, 5, 6
  32. //
  33. // adjustHeap(arr, 0, arr.length);
  34. // System.out.println("第2 次" + Arrays.toString(arr)); // 9,6,8,5,4
  35. //完成我们最终代码
  36. //将无序序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆
  37. for (int i = arr.length / 2 - 1; i >= 0; i--) {
  38. adjustHeap(arr, i, arr.length);
  39. }
  40. /*
  41. * 2).将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;
  42. 3).重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换
  43. 步骤,直到整个序列有序。
  44. */
  45. for (int j = arr.length - 1; j > 0; j--) {
  46. //交换
  47. temp = arr[j];
  48. arr[j] = arr[0];
  49. arr[0] = temp;
  50. adjustHeap(arr, 0, j);
  51. }
  52. //System.out.println("数组=" + Arrays.toString(arr));
  53. }
  54. //将一个数组(二叉树), 调整成一个大顶堆
  55. /**
  56. * 功能: 完成将以i 对应的非叶子结点的树调整成大顶堆
  57. * 举例int arr[] = {4, 6, 8, 5, 9}; => i = 1 => adjustHeap => 得到{4, 9, 8, 5, 6}
  58. * 如果我们再次调用adjustHeap 传入的是i = 0 => 得到{4, 9, 8, 5, 6} => {9,6,8,5, 4}
  59. *
  60. * @param arr 待调整的数组
  61. * @param i 表示非叶子结点在数组中索引
  62. * @param lenght 表示对多少个元素继续调整, length 是在逐渐的减少
  63. */
  64. public static void adjustHeap(int arr[], int i, int lenght) {
  65. int temp = arr[i];//先取出当前元素的值,保存在临时变量
  66. //开始调整
  67. //说明
  68. //1. k = i * 2 + 1 k 是i 结点的左子结点
  69. for (int k = i * 2 + 1; k < lenght; k = k * 2 + 1) {
  70. if (k + 1 < lenght && arr[k] < arr[k + 1]) { //说明左子结点的值小于右子结点的值
  71. k++; // k 指向右子结点
  72. }
  73. if (arr[k] > temp) { //如果子结点大于父结点
  74. arr[i] = arr[k]; //把较大的值赋给当前结点
  75. i = k; //!!! i 指向k,继续循环比较
  76. } else {
  77. break;//!
  78. }
  79. }
  80. //当for 循环结束后,我们已经将以i 为父结点的树的最大值,放在了最顶(局部)
  81. arr[i] = temp;//将temp 值放到调整后的位置
  82. }
  83. }

4.运行结果

  1. 堆排序!!
  2. 排序后={4,5,6,8,9}

5. 效率测试(800w 3s)

  1. //测试速度
  2. 排序前
  3. 排序前的时间是=2021-04-17 15:33:48
  4. 堆排序!!
  5. 排序前的时间是=2021-04-17 15:33:51
  6. Process finished with exit code 0

其他备注

1.排序算法之 堆排序 及其时间复杂度和空间复杂度

11.2 赫夫曼树

11.2.1 基本介绍

1.最优二叉树定义

给定n 个权值作为n 个叶子结点,构造一棵二叉树,若该树的带权路径长度(wpl)达到最小,称这样的二叉树为 最优二叉树,也称为哈夫曼树(Huffman Tree), 还有的书翻译为霍夫曼树。

2.最优二叉树特点

赫夫曼树是带权路径长度最短的树,权值较大的结点离根较近

11.2.2 赫夫曼树几个重要概念和举例说明

1.路径和路径长度:

在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径。通路中分支的数目称为路径长度。若规定根结点的层数为1,则从根结点到第L 层结点的路径长度为L-1

2.结点的权及带权路径长度:

若将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权结 点的带权路径长度为:从根结点到该结点之间的路径长度与该结点的权的乘积

3.树的带权路径长度:

树的带权路径长度规定为所有叶子结点的带权路径长度之和,记为WPL(weighted path length) ,权值越大的结点离根结点越近的二叉树才是最优二叉树。

4.WPL 最小的就是赫夫曼树

java数据结构 第11章--树结构实际应用 - 图12
(第二颗权值最小,为赫夫曼树)

11.2.3 赫夫曼树创建思路图解

给你一个数列{13, 7, 8, 3, 29, 6, 1},要求转成一颗赫夫曼树.

1.思路分析(示意图):构成赫夫曼树的步骤:

{13, 7, 8, 3, 29, 6, 1}
构成赫夫曼树的步骤:
1) 从小到大进行排序, 将每一个数据,每个数据都是一个节点, 每个节点可以看成是一颗最简单的二叉树
2) 取出根节点权值最小的两颗二叉树
3) 组成一颗新的二叉树, 该新的二叉树的根节点的权值是前面两颗二叉树根节点权值的和
4) 再将这颗新的二叉树,以根节点的权值大小再次排序, 不断重复1-2-3-4 的步骤,直到数列中,所有的数
据都被处理,就得到一颗赫夫曼树
5) 图解:
java数据结构 第11章--树结构实际应用 - 图13

11.2.4 赫夫曼树的代码实现

代码实现:

1.实际代码

  1. package huffmanTree;
  2. import java.util.ArrayList;
  3. import java.util.Collections;
  4. import java.util.List;
  5. public class HuffmanTree {
  6. public static void main(String[] args) {
  7. int arr[] = { 13, 7, 8, 3, 29, 6, 1 };
  8. Node root = createHuffmanTree(arr);
  9. //测试一把
  10. preOrder(root); //
  11. }
  12. //编写一个前序遍历的方法
  13. public static void preOrder(Node root) {
  14. if(root != null) {
  15. root.preOrder();
  16. }else{
  17. System.out.println("是空树,不能遍历~~");
  18. }
  19. }
  20. // 创建赫夫曼树的方法
  21. /**
  22. *
  23. * @param arr 需要创建成哈夫曼树的数组
  24. * @return 创建好后的赫夫曼树的root 结点
  25. */
  26. public static Node createHuffmanTree(int[] arr) {
  27. // 第一步为了操作方便
  28. // 1. 遍历arr 数组
  29. // 2. 将arr 的每个元素构成成一个Node
  30. // 3. 将Node 放入到ArrayList 中
  31. List<Node> nodes = new ArrayList<Node>();
  32. for (int value : arr) {
  33. nodes.add(new Node(value));
  34. }
  35. //我们处理的过程是一个循环的过程
  36. while(nodes.size() > 1) {
  37. //排序从小到大
  38. Collections.sort(nodes);
  39. System.out.println("nodes =" + nodes);
  40. //取出根节点权值最小的两颗二叉树
  41. //(1) 取出权值最小的结点(二叉树)
  42. Node leftNode = nodes.get(0);
  43. //(2) 取出权值第二小的结点(二叉树)
  44. Node rightNode = nodes.get(1);
  45. //(3)构建一颗新的二叉树
  46. Node parent = new Node(leftNode.value + rightNode.value);
  47. parent.left = leftNode;
  48. parent.right = rightNode;
  49. //(4)从ArrayList 删除处理过的二叉树
  50. nodes.remove(leftNode);
  51. nodes.remove(rightNode);
  52. //(5)将parent 加入到nodes
  53. nodes.add(parent);
  54. }
  55. //返回哈夫曼树的root 结点
  56. return nodes.get(0);
  57. }
  58. }
  59. // 创建结点类
  60. // 为了让Node 对象持续排序Collections 集合排序
  61. // 让Node 实现Comparable 接口
  62. class Node implements Comparable<Node> {
  63. int value; // 结点权值
  64. Node left; // 指向左子结点
  65. Node right; // 指向右子结点
  66. //写一个前序遍历
  67. public void preOrder() {
  68. System.out.println(this);
  69. if(this.left != null) {
  70. this.left.preOrder();
  71. }
  72. if(this.right != null) {
  73. this.right.preOrder();
  74. }
  75. }
  76. public Node(int value) {
  77. this.value = value;
  78. }
  79. @Override
  80. public String toString() {
  81. return "Node [value=" + value + "]";
  82. }
  83. @Override
  84. public int compareTo(Node o) {
  85. // TODO Auto-generated method stub
  86. // 表示从小到大排序
  87. return this.value - o.value;
  88. }
  89. }

2.运行结果

nodes=[Node{value=1}, Node{value=3}, Node{value=6}, Node{value=7}, Node{value=8}, Node{value=13}, Node{value=29}]

第一次处理后[Node{value=6}, Node{value=7}, Node{value=8}, Node{value=13}, Node{value=29}, Node{value=4}]

Node{value=67}
Node{value=29}
Node{value=38}
Node{value=15}
Node{value=7}
Node{value=8}
Node{value=23}
Node{value=10}
Node{value=4}
Node{value=1}
Node{value=3}
Node{value=6}
Node{value=13}
Process finished with exit code 0

知识点补充

1.Java 中 Comparable 接口的意义和用法.
2.Java 在什么情况下要重写toString
3.Java基础之重写equals、hashCode和compareTo方法
4.java中foreach的用法
5.Java集合(二):List列表