力扣207 课程表

207. 课程表

你这个学期必须选修 numCourse 门课程,记为 0 到 numCourse-1 。

在选修某些课程之前需要一些先修课程。 例如,想要学习课程 0 ,你需要先完成课程 1 ,我们用一个匹配来表示他们:[0,1]

给定课程总量以及它们的先决条件,请你判断是否可能完成所有课程的学习?

示例 1:

输入: 2, [[1,0]]

输出: true

解释: 总共有 2 门课程。学习课程 1 之前,你需要完成课程 0。所以这是可能的。

示例 2:

输入: 2, [[1,0],[0,1]]

输出: false

解释: 总共有 2 门课程。学习课程 1 之前,你需要先完成课程 0;并且学习课程 0 之前,你还应先完成课程 1。这是不可能的。

提示:

输入的先决条件是由 边缘列表 表示的图形,而不是 邻接矩阵 。详情请参见图的表示法。

你可以假定输入的先决条件中没有重复的边。

1 <= numCourses <= 10^5

来源:力扣(LeetCode)

链接:https://leetcode-cn.com/problems/course-schedule

著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

官方题解

前言
本题和 210. 课程表 II 是几乎一样的题目。如果在过去完成过该题,那么只要将代码中的返回值从「非空数组 / 空数组」修改成「\text{True}True / \text{False}False」就可以通过本题。

本题是一道经典的「拓扑排序」问题。

给定一个包含 nn 个节点的有向图 GG,我们给出它的节点编号的一种排列,如果满足:

对于图 GG 中的任意一条有向边 (u, v)(u,v),uu 在排列中都出现在 vv 的前面。

那么称该排列是图 GG 的「拓扑排序」。根据上述的定义,我们可以得出两个结论:
image.png

有了上述的简单分析,我们就可以将本题建模成一个求拓扑排序的问题了:

我们将每一门课看成一个节点;

如果想要学习课程 AA 之前必须完成课程 BB,那么我们从 BB 到 AA 连接一条有向边。这样以来,在拓扑排序中,BB 一定出现在 AA 的前面。

求出该图是否存在拓扑排序,就可以判断是否有一种符合要求的课程学习顺序。事实上,由于求出一种拓扑排序方法的最优时间复杂度为 O(n+m)O(n+m),其中 nn 和 mm 分别是有向图 GG 的节点数和边数,方法见 210. 课程表 II 的官方题解。而判断图 GG 是否存在拓扑排序,至少也要对其进行一次完整的遍历,时间复杂度也为 O(n+m)O(n+m)。因此不可能存在一种仅判断图是否存在拓扑排序的方法,它的时间复杂度在渐进意义上严格优于 O(n+m)O(n+m)。这样一来,我们使用和 210. 课程表 II 完全相同的方法,但无需使用数据结构记录实际的拓扑排序。为了叙述的完整性,下面的两种方法与 210. 课程表 II 的官方题解 完全相同,但在「算法」部分后的「优化」部分说明了如何省去对应的数据结构。

方法一:深度优先搜索
思路

我们可以将深度优先搜索的流程与拓扑排序的求解联系起来,用一个栈来存储所有已经搜索完成的节点。

对于一个节点 uu,如果它的所有相邻节点都已经搜索完成,那么在搜索回溯到 uu 的时候,uu 本身也会变成一个已经搜索完成的节点。这里的「相邻节点」指的是从 uu 出发通过一条有向边可以到达的所有节点。

假设我们当前搜索到了节点 uu,如果它的所有相邻节点都已经搜索完成,那么这些节点都已经在栈中了,此时我们就可以把 uu 入栈。可以发现,如果我们从栈顶往栈底的顺序看,由于 uu 处于栈顶的位置,那么 uu 出现在所有 uu 的相邻节点的前面。因此对于 uu 这个节点而言,它是满足拓扑排序的要求的。

这样以来,我们对图进行一遍深度优先搜索。当每个节点进行回溯的时候,我们把该节点放入栈中。最终从栈顶到栈底的序列就是一种拓扑排序。

算法

对于图中的任意一个节点,它在搜索的过程中有三种状态,即:

「未搜索」:我们还没有搜索到这个节点;

「搜索中」:我们搜索过这个节点,但还没有回溯到该节点,即该节点还没有入栈,还有相邻的节点没有搜索完成);

「已完成」:我们搜索过并且回溯过这个节点,即该节点已经入栈,并且所有该节点的相邻节点都出现在栈的更底部的位置,满足拓扑排序的要求。

通过上述的三种状态,我们就可以给出使用深度优先搜索得到拓扑排序的算法流程,在每一轮的搜索搜索开始时,我们任取一个「未搜索」的节点开始进行深度优先搜索。

我们将当前搜索的节点 uu 标记为「搜索中」,遍历该节点的每一个相邻节点 vv:

如果 vv 为「未搜索」,那么我们开始搜索 vv,待搜索完成回溯到 uu;

如果 vv 为「搜索中」,那么我们就找到了图中的一个环,因此是不存在拓扑排序的;

如果 vv 为「已完成」,那么说明 vv 已经在栈中了,而 uu 还不在栈中,因此 uu 无论何时入栈都不会影响到 (u, v)(u,v) 之前的拓扑关系,以及不用进行任何操作。

当 uu 的所有相邻节点都为「已完成」时,我们将 uu 放入栈中,并将其标记为「已完成」。

在整个深度优先搜索的过程结束后,如果我们没有找到图中的环,那么栈中存储这所有的 nn 个节点,从栈顶到栈底的顺序即为一种拓扑排序。

下面的幻灯片给出了深度优先搜索的可视化流程。图中的「白色」「黄色」「绿色」节点分别表示「未搜索」「搜索中」「已完成」的状态。

优化
由于我们只需要判断是否存在一种拓扑排序,而栈的作用仅仅是存放最终的拓扑排序结果,因此我们可以只记录每个节点的状态,而省去对应的栈。

  1. class Solution {
  2. private:
  3. vector<vector<int>> edges;
  4. vector<int> visited;
  5. bool valid = true;
  6. public:
  7. void dfs(int u) {
  8. visited[u] = 1;
  9. for (int v: edges[u]) {
  10. if (visited[v] == 0) {
  11. dfs(v);
  12. if (!valid) {
  13. return;
  14. }
  15. }
  16. else if (visited[v] == 1) {
  17. valid = false;
  18. return;
  19. }
  20. }
  21. visited[u] = 2;
  22. }
  23. bool canFinish(int numCourses, vector<vector<int>>& prerequisites) {
  24. edges.resize(numCourses);
  25. visited.resize(numCourses);
  26. for (const auto& info: prerequisites) {
  27. edges[info[1]].push_back(info[0]);
  28. }
  29. for (int i = 0; i < numCourses && valid; ++i) {
  30. if (!visited[i]) {
  31. dfs(i);
  32. }
  33. }
  34. return valid;
  35. }
  36. };

复杂度分析

时间复杂度: O(n+m),其中 nn 为课程数,mm 为先修课程的要求数。这其实就是对图进行深度优先搜索的时间复杂度。

空间复杂度: O(n+m)。题目中是以列表形式给出的先修课程关系,为了对图进行深度优先搜索,我们需要存储成邻接表的形式,空间复杂度为 O(n+m)。在深度优先搜索的过程中,我们需要最多 O(n)的栈空间(递归)进行深度优先搜索,因此总空间复杂度为 O(n+m)。

方法二: 广度优先搜索
思路

方法一的深度优先搜索是一种「逆向思维」:最先被放入栈中的节点是在拓扑排序中最后面的节点。我们也可以使用正向思维,顺序地生成拓扑排序,这种方法也更加直观。

我们考虑拓扑排序中最前面的节点,该节点一定不会有任何入边,也就是它没有任何的先修课程要求。当我们将一个节点加入答案中后,我们就可以移除它的所有出边,代表着它的相邻节点少了一门先修课程的要求。如果某个相邻节点变成了「没有任何入边的节点」,那么就代表着这门课可以开始学习了。按照这样的流程,我们不断地将没有入边的节点加入答案,直到答案中包含所有的节点(得到了一种拓扑排序)或者不存在没有入边的节点(图中包含环)。

上面的想法类似于广度优先搜索,因此我们可以将广度优先搜索的流程与拓扑排序的求解联系起来。

算法

我们使用一个队列来进行广度优先搜索。初始时,所有入度为 00 的节点都被放入队列中,它们就是可以作为拓扑排序最前面的节点,并且它们之间的相对顺序是无关紧要的。

在广度优先搜索的每一步中,我们取出队首的节点 uu:

我们将 uu 放入答案中;

我们移除 uu 的所有出边,也就是将 uu 的所有相邻节点的入度减少 11。如果某个相邻节点 vv 的入度变为 00,那么我们就将 vv 放入队列中。

在广度优先搜索的过程结束后。如果答案中包含了这 nn 个节点,那么我们就找到了一种拓扑排序,否则说明图中存在环,也就不存在拓扑排序了。

优化

由于我们只需要判断是否存在一种拓扑排序,因此我们省去存放答案数组,而是只用一个变量记录被放入答案数组的节点个数。在广度优先搜索结束之后,我们判断该变量的值是否等于课程数,就能知道是否存在一种拓扑排序。

  1. class Solution {
  2. private:
  3. vector<vector<int>> edges;
  4. vector<int> indeg;
  5. public:
  6. bool canFinish(int numCourses, vector<vector<int>>& prerequisites) {
  7. edges.resize(numCourses);
  8. indeg.resize(numCourses);
  9. for (const auto& info: prerequisites) {
  10. edges[info[1]].push_back(info[0]);
  11. ++indeg[info[0]];
  12. }
  13. queue<int> q;
  14. for (int i = 0; i < numCourses; ++i) {
  15. if (indeg[i] == 0) {
  16. q.push(i);
  17. }
  18. }
  19. int visited = 0;
  20. while (!q.empty()) {
  21. ++visited;
  22. int u = q.front();
  23. q.pop();
  24. for (int v: edges[u]) {
  25. --indeg[v];
  26. if (indeg[v] == 0) {
  27. q.push(v);
  28. }
  29. }
  30. }
  31. return visited == numCourses;
  32. }
  33. };

复杂度分析

时间复杂度: O(n+m),其中 nn 为课程数,mm 为先修课程的要求数。这其实就是对图进行广度优先搜索的时间复杂度。

空间复杂度: O(n+m)。题目中是以列表形式给出的先修课程关系,为了对图进行广度优先搜索,我们需要存储成邻接表的形式,空间复杂度为 O(n+m)。在广度优先搜索的过程中,我们需要最多 O(n) 的队列空间(迭代)进行广度优先搜索。因此总空间复杂度为 O(n+m)。