【数据结构与算法基础】代码仓库:https://github.com/jinrunheng/datastructure-and-algorithm

一:哈密尔顿回路和哈密尔顿路径

1859 年,爱尔兰数学家哈密尔顿(Hamilton)提出了一个“周游世界”的游戏:

在一个正十二面体的二十个顶点上,标注了伦敦,巴黎,莫斯科等世界著名大城市,正十二面体的棱表示连接着这些城市的路线。要求游戏参与者从某个城市出发,把所有的城市都走过一次,且仅走过一次,然后回到出发点。这就是著名的哈密尔顿回路问题。

image.png
简而言之,哈密尔顿回路是指,从图中的一个顶点出发,沿着边行走,经过每个顶点恰好一次,之后再回到出发点。
image.png
对于上面给出的示例图中,左图就存在哈密尔顿回路,而右图不存在哈密尔顿回路。

不过,右图是存在哈密尔顿路径的,哈密尔顿路径和哈密尔顿回路的定义只有一点不同,不同点在于哈密尔顿回路要求从起始点出发,遍历每个顶点且每个顶点仅遍历一次,并能回到起始点(回路);哈密尔顿路径则是要求从起始点出发,遍历图的每个顶点且每个顶点仅遍历一次,不需要能回到起始点,也就是说,起始点和终止点不要求有一条边

对于右边这个图来说,0->1->2->3 和 3->2->1->0 都是可行的哈密尔顿路径,但是,由于顶点 0 和顶点 3 之间没有边,所以不构成哈密尔顿回路。

二:求解哈密尔顿回路

代码链接🔗:1
代码链接🔗:2
代码链接🔗:3

如何求解哈密尔顿回路?

image.png
我们能想到最简单的方法就是暴力求解。类似于求解全排列问题,我们遍历图的每一个顶点 v,然后从 v 开始出发,看是否能够找到一条哈密尔顿回路。

我们知道,全排列问题的时间复杂度为 O(n!)。O(n!) 并不是一个多项式级别的复杂度。像 O(1),O(nlogn),O(n2) 这种级别的复杂度都是多项式级的复杂度,而像 O(an),O(n!) 这样的复杂度是非多项式级的,其复杂度之高,往往在数据量极大的情况下,计算机是不能承受的。

像哈密尔顿回路问题,目前除了暴力求解这种方法之外,我们还没有找到一种多项式级别的算法来求解这道问题,通常像这种问题被称为 NP(Non-deterministic Polynomial) 难的问题。

求解哈密尔顿回路的算法采用回溯的思想来简化暴力破解,过程模拟在 PPT 中:

hamiltonLoop.key

代码如下:

  1. package com.github.datastructureandalgorithm.graph.chapter9;
  2. import java.util.ArrayList;
  3. import java.util.Collections;
  4. import java.util.List;
  5. public class HamiltonLoop {
  6. private Graph G;
  7. private boolean[] visited;
  8. private int[] pre;
  9. private int end; // end 表示 哈密尔顿回路是从 0 开始遍历到 end,end 是哈密尔顿回路的最后一个顶点
  10. public HamiltonLoop(Graph G) {
  11. this.G = G;
  12. visited = new boolean[G.V()];
  13. pre = new int[G.V()];
  14. end = -1;
  15. dfs(0, 0);
  16. }
  17. /**
  18. * 对图进行深度优先遍历
  19. *
  20. * @param v
  21. */
  22. private boolean dfs(int v, int parent) {
  23. visited[v] = true;
  24. pre[v] = parent;
  25. for (int w : G.adj(v)) {
  26. if (!visited[w]) {
  27. if (dfs(w, v)) return true;
  28. } else if (w == 0 && allVisited()) {
  29. end = v;
  30. return true;
  31. }
  32. }
  33. visited[v] = false;
  34. return false;
  35. }
  36. private boolean allVisited() {
  37. for (boolean b : visited)
  38. if (!b) return false;
  39. return true;
  40. }
  41. /**
  42. * 获取哈密尔顿回路
  43. *
  44. * @return
  45. */
  46. public List<Integer> result() {
  47. List<Integer> res = new ArrayList<>();
  48. if (end == -1) return res;
  49. int cur = end;
  50. while (cur != 0) {
  51. res.add(cur);
  52. cur = pre[cur];
  53. }
  54. res.add(0);
  55. Collections.reverse(res);
  56. return res;
  57. }
  58. }

上面的代码中,我们的 allVisited 方法需要遍历一次 visited 数组。我们可以对我们的代码进行改进,设置一个变量 left,表示还有多少个顶点没有遍历到,每次的 dfs 过程中,都维护这个变量,直到 left == 0 时,说明所有的顶点都被遍历过了,改进的代码如下:

  1. package com.github.datastructureandalgorithm.graph.chapter9;
  2. import java.util.ArrayList;
  3. import java.util.Collections;
  4. import java.util.List;
  5. public class HamiltonLoop2 {
  6. private Graph G;
  7. private boolean[] visited;
  8. private int[] pre;
  9. private int end;
  10. private int left;
  11. public HamiltonLoop2(Graph G) {
  12. this.G = G;
  13. visited = new boolean[G.V()];
  14. pre = new int[G.V()];
  15. end = -1;
  16. left = G.V();
  17. dfs(0, 0);
  18. }
  19. /**
  20. * 对图进行深度优先遍历
  21. *
  22. * @param v
  23. * @param parent
  24. * @return
  25. */
  26. private boolean dfs(int v, int parent) {
  27. visited[v] = true;
  28. pre[v] = parent;
  29. left--;
  30. for (int w : G.adj(v)) {
  31. if (!visited[w]) {
  32. if (dfs(w, v)) return true;
  33. } else if (w == 0 && left == 0) {
  34. end = v;
  35. return true;
  36. }
  37. }
  38. visited[v] = false;
  39. left++;
  40. return false;
  41. }
  42. /**
  43. * 获取哈密尔顿回路
  44. *
  45. * @return
  46. */
  47. public List<Integer> result() {
  48. List<Integer> res = new ArrayList<>();
  49. if (end == -1) return res;
  50. int cur = end;
  51. while (cur != 0) {
  52. res.add(cur);
  53. cur = pre[cur];
  54. }
  55. res.add(0);
  56. Collections.reverse(res);
  57. return res;
  58. }
  59. }

三:求解哈密尔顿路径

代码连接🔗

求解哈密尔顿路径和求解哈密尔顿回路的算法整体框架是基本一致的。

对于求解哈密尔顿路径来说,起始点是谁很重要,同一个图,从有的起始点出发就存在哈密尔顿路径,从有的起始点出发就不存在哈密尔顿路径。所以,我们在算法设计中,构造函数需要用户显示地传入起始点。

我们的哈密尔顿路径求解的算法类 HamiltonPath 的构造函数是这样的:

  1. public HamiltonPath(Graph G,int s)

除了这一点外,求解哈密尔顿路径只需要保证,从起始点开始,所有的点被遍历过且仅被遍历一次,并不需要起始点和终止点之间有边。

所以,在 dfs 的逻辑中,我们只需要改变递归的终止条件即可:

  1. // 不需要保证终止点 v 和 起始点 s 存在一条边,即: G.hasEdge(v, s)
  2. if(left == 0 /*&& G.hasEdge(v, s)*/){
  3. end = v;
  4. return true;
  5. }

代码如下:

  1. package com.github.datastructureandalgorithm.graph.chapter9;
  2. import java.util.ArrayList;
  3. import java.util.Collections;
  4. import java.util.List;
  5. public class HamiltonPath {
  6. private Graph G;
  7. private int s;
  8. private boolean[] visited;
  9. private int[] pre;
  10. private int end;
  11. private int left;
  12. public HamiltonPath(Graph G, int s) {
  13. this.G = G;
  14. this.s = s;
  15. visited = new boolean[G.V()];
  16. pre = new int[G.V()];
  17. end = -1;
  18. this.left = G.V();
  19. dfs(s, s);
  20. }
  21. private boolean dfs(int v, int parent) {
  22. visited[v] = true;
  23. pre[v] = parent;
  24. left--;
  25. if (left == 0) {
  26. end = v;
  27. return true;
  28. }
  29. for (int w : G.adj(v)) {
  30. if (!visited[w]) {
  31. if (dfs(w, v)) return true;
  32. }
  33. }
  34. visited[v] = false;
  35. left++;
  36. return false;
  37. }
  38. /**
  39. * 返回哈密尔顿路径
  40. *
  41. * @return
  42. */
  43. public List<Integer> result() {
  44. List<Integer> res = new ArrayList<>();
  45. if (end == -1) return res;
  46. int cur = end;
  47. while (cur != s) {
  48. res.add(cur);
  49. cur = pre[cur];
  50. }
  51. res.add(s);
  52. Collections.reverse(res);
  53. return res;
  54. }
  55. }

四:LeetCode 上的哈密尔顿问题:不同路径III

980. 不同路径 III

代码链接🔗

本题是一道经典的求解哈密尔顿路径问题,使用经典的回溯法即可解决,就不再赘述了,详情请见代码:

  1. class Solution {
  2. private int[][] grid;
  3. private int r, c;
  4. private boolean[][] visited;
  5. private int left;
  6. private int start;
  7. private int end;
  8. private int[][] dirs = {{-1, 0}, {0, 1}, {1, 0}, {0, -1}};
  9. public int uniquePathsIII(int[][] grid) {
  10. this.grid = grid;
  11. this.r = grid.length;
  12. this.c = grid[0].length;
  13. this.visited = new boolean[r][c];
  14. this.left = r * c;
  15. for (int i = 0; i < r; i++)
  16. for (int j = 0; j < c; j++)
  17. if (grid[i][j] == 1) {
  18. start = i * c + j;
  19. grid[i][j] = 0;
  20. } else if (grid[i][j] == 2) {
  21. end = i * c + j;
  22. grid[i][j] = 0;
  23. } else if (grid[i][j] == -1) {
  24. left--;
  25. }
  26. return dfs(start);
  27. }
  28. int dfs(int s) {
  29. int x = s / c;
  30. int y = s % c;
  31. visited[x][y] = true;
  32. left--;
  33. if (s == end && left == 0) {
  34. // 回溯
  35. visited[x][y] = false;
  36. left++;
  37. return 1;
  38. }
  39. int res = 0;
  40. for (int d = 0; d < 4; d++) {
  41. int nextX = x + dirs[d][0];
  42. int nextY = y + dirs[d][1];
  43. if (isValid(nextX, nextY) && !visited[nextX][nextY] && grid[nextX][nextY] != -1) {
  44. int next = nextX * c + nextY;
  45. res += dfs(next);
  46. }
  47. }
  48. // 回溯
  49. visited[x][y] = false;
  50. left++;
  51. return res;
  52. }
  53. private boolean isValid(int x, int y) {
  54. return x >= 0 && x < r && y >= 0 && y < c;
  55. }
  56. }

五:状态压缩

哈密尔顿回路状态压缩代码链接🔗
哈密尔顿路径状态压缩代码链接🔗

在我们的代码中,一直都使用布尔型的 visited 数组来记录图中的每一个顶点是否有被遍历过。在算法面试中,对于像哈密尔顿回路/路径这样的 NP 难问题,通常都会有输入限制,一般情况下,求解问题中给定的图不会超过 30 个顶点。

我们可以使用状态压缩的思想,将 visited 数组简化成一个数字。我们知道一个 int 型的数字有 32 位,每一位不是 1 就是 0,这正好对应了布尔型的 true 和 false。

来看一下我们的代码:
image.png
我们的 dfs 中,涉及到 visited 数组的操作共有三处,这三处对布尔型数组的赋值操作可以转换为位运算的操作:

  • 如果第 i 位为 0,设为 1;

    1. visited + (1 << i);
  • 看其第 i 位是否为 1;

    1. visited & (1 << i) == 0 ?
  • 如果第 i 位为 1,设为 0;

    1. visited - (1 << i) == 0;

    具体改动代码请参考链接。

六:记忆化搜索

我们来看一下,我们当前的算法类有什么问题:

image.png
对于上面这个图来说,因为顶点 3 和顶点 4 之间只有一条边,所以肯定是不会构成一条哈密尔顿回路的。

但是我们的回溯算法在遍历顶点时,不会提前返回结果,譬如:

image.png
依次遍历 0 -> 1 -> 2 -> 3 … 这些顶点,图中,0,1,2,3 这些顶点都已经被访问过,所以我对这些顶点标记为蓝色;我们发现找不到一条哈密尔顿回路。

而下一次的遍历,则会依次遍历 0 -> 2 -> 1 -> 3 这些顶点,我们遍历左侧的图的最后一个顶点仍然为 3,且左侧的四个顶点都已经被遍历过。这个时候我们知道,其实可以提前返回结果,但是我们的算法类不具有这个功能。

要想实现提前返回这个功能,就需要在我们设计的算法类中加入记忆化搜索

实现记忆化搜索非常简单,在我们设计算法类中,再开辟一个数组memory[1 << G.V()][G.V()] 对应着 dfs 的方法签名中的 dfs(visited,v)。我们开辟的 memory 将会记录 visited 和 v 这个组合有没有计算过,像上面给定的示例,两次遍历中,左侧的四个顶点都已经被访问过了,且最后遍历都落到了 3 这个顶点,我们在第一次遍历时,就可以记录这个状态,等到第二次遍历时,发现这个状态已经出现过,就可以避免重复遍历。

添加了记忆化搜索的时间复杂度和回溯法的时间复杂度不同,记忆化搜索的时间复杂度为:8、哈密尔顿问题和状态压缩 - 图7相比于回溯法的 8、哈密尔顿问题和状态压缩 - 图8 来讲实际上各有利弊,因为我们的回溯法中也有剪枝的过程。但是,整体上来讲,随着 n 的不断增大,8、哈密尔顿问题和状态压缩 - 图9 的复杂度是要高于 8、哈密尔顿问题和状态压缩 - 图10 的。

现在,我们针对于 LeetCode 980. 不同路径 III 这个问题,来添加上记忆化搜索,看一下执行的效率如何。

  1. import java.util.Arrays;
  2. /**
  3. * LeetCode 980.不同路径 III:https://leetcode-cn.com/problems/unique-paths-iii/
  4. * <p>
  5. * 添加了对 visited 状态压缩的优化
  6. * 添加了记忆化搜索
  7. */
  8. public class Solution2 {
  9. private int[][] grid;
  10. private int r, c;
  11. private int left;
  12. private int start;
  13. private int end;
  14. private int[][] dirs = {{-1, 0}, {0, 1}, {1, 0}, {0, -1}};
  15. private int[][] memory;
  16. public int uniquePathsIII(int[][] grid) {
  17. this.grid = grid;
  18. this.r = grid.length;
  19. this.c = grid[0].length;
  20. this.left = r * c;
  21. int visited = 0;
  22. this.memory = new int[1 << r * c][r * c];
  23. for (int i = 0; i < memory.length; i++)
  24. Arrays.fill(memory[i], -1);
  25. for (int i = 0; i < r; i++)
  26. for (int j = 0; j < c; j++)
  27. if (grid[i][j] == 1) {
  28. start = i * c + j;
  29. grid[i][j] = 0;
  30. } else if (grid[i][j] == 2) {
  31. end = i * c + j;
  32. grid[i][j] = 0;
  33. } else if (grid[i][j] == -1) {
  34. left--;
  35. }
  36. return dfs(visited, start);
  37. }
  38. int dfs(int visited, int s) {
  39. // 说明该状态已经被记录过
  40. if (memory[visited][s] != -1)
  41. return memory[visited][s];
  42. visited += (1 << s);
  43. left--;
  44. if (s == end && left == 0) {
  45. // 回溯
  46. visited -= (1 << s);
  47. left++;
  48. memory[visited][s] = 1;
  49. return 1;
  50. }
  51. int res = 0;
  52. int x = s / c;
  53. int y = s % c;
  54. for (int d = 0; d < 4; d++) {
  55. int nextX = x + dirs[d][0];
  56. int nextY = y + dirs[d][1];
  57. int next = nextX * c + nextY;
  58. if (isValid(nextX, nextY) && (visited & (1 << next)) == 0 && grid[nextX][nextY] != -1) {
  59. res += dfs(visited, next);
  60. }
  61. }
  62. // 回溯
  63. visited -= (1 << s);
  64. left++;
  65. memory[visited][s] = res;
  66. return res;
  67. }
  68. private boolean isValid(int x, int y) {
  69. return x >= 0 && x < r && y >= 0 && y < c;
  70. }
  71. }

在我的电脑上,使用回溯算法的执行效率为:

image.png
添加了记忆化搜索之后,算法的执行效率为:
image.png

对于 LeetCode 上这道问题,添加了记忆化搜索之后,我们提交的代码执行时间实际上是更慢了,原因就在于,我们开辟 memory 数组的时间上。虽然我们的算法解决了重复遍历的情况,但是对于没有那么多重复的情况下,我们的记忆化搜索也不一定有回溯更快,这一点望大家可以了解。