• 哈夫曼树的构造
  • 哈夫曼编码的构造

一、哈夫曼树的构造

首先给出树的几个概念:

  • 路径:从树种一个结点到另一个结点之间的分支构成这两个结点之间的路径,路径上的分支数目称作路径长度
  • 树的路径长度:从树根到每一个结点的路径长度之和。
  • 结点的带权路径长度:为从该结点到树根的之间的路径长度与结点上权的成绩。
  • 树的带权路径长度:为数中所有叶子结点的带权路径长度之和。

哈夫曼树和哈夫曼编码 - 图1

哈夫曼树和哈夫曼编码 - 图2

  • 构建哈夫曼树的思想其实就是贪心的思想,每次在目前可选的树结点中,选取两个最小的结点,构造成一颗新的二叉树,直到只有一棵树为止

二、哈夫曼编码的构造

哈夫曼树和哈夫曼编码 - 图3

那么如何构造出最优的前缀编码,也就是赫夫曼编码呢?

哈夫曼树和哈夫曼编码 - 图4

注意这里的huffCodes存储的哈夫曼编码的技巧:

  • 首先我是从每一个叶子从下往上去构造哈夫曼编码;
  • 然后我的数组也是从每一行的最后一个开始构造(idx = n - 1)
  • 也就是说每一个一维数组内,我是从最后开始存,存的是从叶子到根的,存完之后,加上一个-1,然后我输出的时候,从数组的前面开始,碰到-1,就说明编码的开始(也就是说译码其实是从根到叶子的过程,但是这里是从叶子到根构建的);

看下图:

哈夫曼树和哈夫曼编码 - 图5

代码如下:

  1. import java.util.LinkedList;
  2. import java.util.Queue;
  3. public class HuffmanTree {
  4. private static class Node {
  5. private int val;
  6. private boolean flag; //标记是否已经被选
  7. private Node parent; // 父亲结点
  8. private Node left;
  9. private Node right;
  10. public Node(int val) {
  11. this(val, false , null, null, null);
  12. }
  13. public Node(int val, boolean flag, Node parent, Node left, Node right) {
  14. super();
  15. this.val = val;
  16. this.flag = flag;
  17. this.parent = parent;
  18. this.left = left;
  19. this.right = right;
  20. }
  21. }
  22. //每次选出一个最小的结点的函数
  23. public static Node selectMin(Node[] HN,int end){ //找到最小的一个结点
  24. Node minNode = HN[end];
  25. for(int i = 0; i <= end; i++){
  26. if(HN[i].flag == false && HN[i].val < minNode.val){
  27. minNode = HN[i];
  28. }
  29. }
  30. return minNode;
  31. }
  32. //建立赫夫曼树
  33. public static Node[] build(int[] w){
  34. int m = w.length * 2 - 1;
  35. Node[] HN = new Node[m+1];
  36. for(int i = 0; i < w.length; i++) //先建立好前面的叶子结点
  37. HN[i] = new Node(w[i]);
  38. /**
  39. * 已经有w.length - 1个叶子结点,现在要建立 从w.length ~ (2*w.length-1) 的结点
  40. */
  41. for(int i = w.length; i < m; i++){
  42. Node firstNode = selectMin(HN, i-1); //从前面的结点中找到第一个最小的
  43. firstNode.flag = true;
  44. Node secondNode = selectMin(HN, i-1); //从前面的结点中找到第二个最小的
  45. secondNode.flag = true;
  46. HN[i] = new Node(firstNode.val + secondNode.val); //新结点的值是两个最小结点的和
  47. //设置好孩子和孩子的父亲
  48. HN[i].left = firstNode;
  49. HN[i].right = secondNode;
  50. firstNode.parent = HN[i];
  51. secondNode.parent = HN[i];
  52. }
  53. return HN; //返回结点数组
  54. }
  55. public static void leverOrder(Node root){
  56. if(root == null)
  57. return;
  58. Queue<Node> que = new LinkedList<Node>();
  59. que.add(root);
  60. while(!que.isEmpty()){
  61. Node cur = que.poll();
  62. System.out.print(cur.val + " ");
  63. if(cur.left != null)
  64. que.add(cur.left);
  65. if(cur.right != null)
  66. que.add(cur.right);
  67. }
  68. System.out.println();
  69. }
  70. //哈夫曼编码 : 从叶子到根的一个路径
  71. public static int[][] huffmanCoding(Node[] HN, int n){
  72. int[][] huffCodes = new int[n][n];
  73. for(int i = 0; i < n; i++){
  74. int idx = n-1; //逆向存储
  75. for(Node cur = HN[i], pa = cur.parent ; pa != null; cur = pa,pa = pa.parent){
  76. if(pa.left == cur) //左孩子为0
  77. huffCodes[i][idx--] = 0;
  78. else //右孩子为1
  79. huffCodes[i][idx--] = 1;
  80. }
  81. huffCodes[i][idx--] = -1; //标记一下 从-1往后的是真的编码 前面的不足
  82. }
  83. return huffCodes;
  84. }
  85. public static void main(String[] args) {
  86. int[] w = {7,5,2,4}; // 给出叶子的权值数组
  87. Node[] HN = build(w);
  88. System.out.println("-----哈夫曼树-----");
  89. leverOrder(HN[2 * w.length - 2]); //最后的根 的下标
  90. int[][] huffCodes = huffmanCoding(HN,w.length); //开始从叶子到根构建编码
  91. System.out.println("----哈夫曼编码-----");
  92. for(int i = 0; i < w.length; i++){
  93. System.out.print(w[i] + ": ");
  94. for(int j = 0; j < huffCodes[i].length; j++){
  95. if(huffCodes[i][j] == -1){ //从-1标记的开始往后的才是编码
  96. for(int k = j + 1; k < huffCodes[i].length; k++)
  97. System.out.print(huffCodes[i][k]);
  98. break;
  99. }
  100. }
  101. System.out.println();
  102. }
  103. }
  104. }

运行效果:

哈夫曼树和哈夫曼编码 - 图6

对照上面的例子,可以看出来是对的。

另一种写法: 使用ArrayList存储哈夫曼编码:

  1. import java.util.ArrayList;
  2. import java.util.LinkedList;
  3. import java.util.Queue;
  4. public class HuffmanTree2 {
  5. private static class Node {
  6. private int val;
  7. private boolean flag; //标记是否已经被选
  8. private Node parent; // 父亲结点
  9. private Node left;
  10. private Node right;
  11. public Node(int val) {
  12. this(val, false , null, null, null);
  13. }
  14. public Node(int val, boolean flag, Node parent, Node left, Node right) {
  15. super();
  16. this.val = val;
  17. this.flag = flag;
  18. this.parent = parent;
  19. this.left = left;
  20. this.right = right;
  21. }
  22. }
  23. //每次选出一个最小的结点的函数
  24. public static Node selectMin(Node[] HN,int end){ //找到最小的一个结点
  25. Node minNode = HN[end];
  26. for(int i = 0; i <= end; i++){
  27. if(HN[i].flag == false && HN[i].val < minNode.val){
  28. minNode = HN[i];
  29. }
  30. }
  31. return minNode;
  32. }
  33. //建立赫夫曼树
  34. public static Node[] build(int[] w){
  35. int m = w.length * 2 - 1;
  36. Node[] HN = new Node[m+1];
  37. for(int i = 0; i < w.length; i++) //先建立好前面的叶子结点
  38. HN[i] = new Node(w[i]);
  39. /**
  40. * 已经有w.length - 1个叶子结点,现在要建立 从w.length ~ (2*w.length-1) 的结点
  41. */
  42. for(int i = w.length; i < m; i++){
  43. Node firstNode = selectMin(HN, i-1); //从前面的结点中找到第一个最小的
  44. firstNode.flag = true;
  45. Node secondNode = selectMin(HN, i-1); //从前面的结点中找到第二个最小的
  46. secondNode.flag = true;
  47. HN[i] = new Node(firstNode.val + secondNode.val); //新结点的值是两个最小结点的和
  48. //设置好孩子和孩子的父亲
  49. HN[i].left = firstNode;
  50. HN[i].right = secondNode;
  51. firstNode.parent = HN[i];
  52. secondNode.parent = HN[i];
  53. }
  54. return HN; //返回结点数组
  55. }
  56. public static void leverOrder(Node root){
  57. if(root == null)
  58. return;
  59. Queue<Node> que = new LinkedList<Node>();
  60. que.add(root);
  61. while(!que.isEmpty()){
  62. Node cur = que.poll();
  63. System.out.print(cur.val + " ");
  64. if(cur.left != null)
  65. que.add(cur.left);
  66. if(cur.right != null)
  67. que.add(cur.right);
  68. }
  69. System.out.println();
  70. }
  71. //哈夫曼编码 : 从叶子到根的一个路径
  72. public static ArrayList[] huffmanCoding(Node[] HN, int n){
  73. ArrayList[] huffCodes = new ArrayList[n];
  74. for(int i = 0; i < huffCodes.length; i++)
  75. huffCodes[i] = new ArrayList<Integer>();
  76. for(int i = 0; i < n; i++){
  77. for(Node cur = HN[i], pa = cur.parent ; pa != null; cur = pa,pa = pa.parent){
  78. if(pa.left == cur) //左孩子为0
  79. huffCodes[i].add(0);
  80. else //右孩子为1
  81. huffCodes[i].add(1);
  82. }
  83. }
  84. return huffCodes;
  85. }
  86. public static void main(String[] args) {
  87. int[] w = {7,5,2,4}; // 给出叶子的权值数组
  88. Node[] HN = build(w);
  89. System.out.println("-----哈夫曼树-----");
  90. leverOrder(HN[2 * w.length - 2]); //最后的根 的下标
  91. ArrayList[] huffCodes = huffmanCoding(HN,w.length); //开始从叶子到根构建编码
  92. System.out.println("----哈夫曼编码-----");
  93. for(int i = 0; i < w.length; i++){
  94. System.out.print(w[i] + ": ");
  95. for(int j = huffCodes[i].size() - 1; j >= 0; j--)
  96. System.out.print(huffCodes[i].get(j));
  97. System.out.println();
  98. }
  99. }
  100. }