深度优先遍历(Depth_First_Search),也有称为深度优先搜索,简称为DFS。它的具体思想就如同找忘记放到哪里了的钥匙一样,无论从哪一间房间开始都可以,比如主卧室,然后从房间的一个角开始,将房间内的墙角、床头柜、床上、床下、衣柜里、衣柜上、前面的电视柜等挨个寻找,做到不放过任何一个死角,所有的抽屉、储藏柜中全部都找遍,形象比喻就是翻个底朝天,然后再寻找下一间,直到找到为止。

    为了更好的理解深度优先遍历,我们来做一个游戏。

    假设你需要完成一个任务,要求你在如图7-5-2左图这样的一个迷宫中,从顶点A开始要走遍所有的图顶点并作上标记,注意不是简单地看着这样的平面图走哦,而是如同现实般地在只有高墙和通道的迷宫中去完成任务。
    image.png
    很显然我们是需要策略的,否则在这四通八达的通道中乱窜,要想完成任务那就只能是碰运气。如果你学过深度优先遍历,这个任务就不难完成了。

    首先我们从顶点A开始,做上表示走过的记号后,面前有两条路,通向B和F,我们给自己定一个原则,在没有碰到重复顶点的情况下,始终是向右手边走,于是走到了B顶点。整个行路过程,可参看图7-5-2的右图。此时发现有三条分支,分别通向顶点C、I、G,右手通行原则,使得我们走到了C顶点。就这样,我们一直顺着右手通道走,一直走到F顶点。当我们依然选择右手通道走过去后,发现走回到顶点A了,因为在这里做了记号表示已经走过。此时我们退回到顶点F,走向从右数的第二条通道,到了G顶点,它有三条通道,发现B和D都已经是走过的,于是走到H,当我们面对通向H的两条通道D和E时,会发现都已经走过了。

    此时我们是否已经遍历了所有顶点呢?没有。可能还有很多分支的顶点我们没有走到,所以我们按原路返回。在顶点H处,再无通道没走过,返回到G,也无未走过通道,返回到F,没有通道,返回到E,有一条通道通往H的通道,验证后也是走过的,再返回到顶点D,此时还有三条道未走过,一条条来,H走过了,G走过了,I,哦,这是一个新顶点,没有标记,赶快记下来。继续返回,直到返回顶点A,确认你已经完成遍历任务,找到了所有的9个顶点。

    反应快的同学一定会感觉到,深度优先遍历其实就是一个递归的过程,如果再敏感一些,会发现其实转换成如图7-5-2的右图后,就像是一棵树的前序遍历,没错,它就是。它从图中某个顶点v出发,访问此顶点,然后从v的未被访问的邻接点出发深度优先遍历图,直至图中所有和v有路径相通的顶点都被访问到。事实上,我们这里讲到的是连通图,对于非连通图,只需要对它的连通分量分别进行深度优先遍历,即在先前一个顶点进行一次深度优先遍历后,若图中尚有顶点未被访问,则另选图中一个未曾被访问的顶点作起始点,重复上述过程,直至图中所有顶点都被访问到为止。

    如果我们用的是邻接矩阵的方式,则代码如下:

    1. /* Boolean是布尔类型,其值是TRUE或FALSE */
    2. typedef int Boolean;
    3. /* 访问标志的数组 */
    4. Boolean visited[MAX];
    5. /* 邻接矩阵的深度优先递归算法 */
    6. void DFS(MGraph G, int i){
    7. int j;
    8. visited[i] = TRUE;
    9. /* 打印顶点,也可以其他操作 */
    10. printf("%c ", G.vexs[i]);
    11. for (j = 0; j < G.numVertexes; j++)
    12. if (G.arc[i][j] == 1 && !visited[j])
    13. /* 对为访问的邻接顶点递归调用 */
    14. DFS(G, j);
    15. }
    16. /* 邻接矩阵的深度遍历操作 */
    17. void DFSTraverse(MGraph G){
    18. int i;
    19. for (i = 0; i < G.numVertexes; i++)
    20. /* 初始所有顶点状态都是未访问过状态 */
    21. visited[i] = FALSE;
    22. for (i = 0; i < G.numVertexes; i++)
    23. /* 对未访问过的顶点调用DFS,若是连通图,只会执行一次 */
    24. if (!visited[i])
    25. DFS(G, i);
    26. }

    代码的执行过程,其实就是我们刚才迷宫找寻所有顶点的过程。

    如果图结构是邻接表结构,其DFSTraverse函数的代码是几乎相同的,只是在递归函数中因为将数组换成了链表而有不同,代码如下。

    1. /* 邻接表的深度优先递归算法 */
    2. void DFS(GraphAdjList GL, int i){
    3. EdgeNode *p;
    4. visited[i] = TRUE;
    5. /* 打印顶点,也可以其他操作 */
    6. printf("%c ", GL->adjList[i].data);
    7. p = GL->adjList[i].firstedge;
    8. while (p){
    9. if (!visited[p->adjvex])
    10. /* 对为访问的邻接顶点递归调用 */
    11. DFS(GL, p->adjvex);
    12. p = p->next;
    13. }
    14. }
    15. /* 邻接表的深度遍历操作 */
    16. void DFSTraverse(GraphAdjList GL){
    17. int i;
    18. for (i = 0; i < GL->numVertexes; i++)
    19. /* 初始所有顶点状态都是未访问过状态 */
    20. visited[i] = FALSE;
    21. for (i = 0; i < GL->numVertexes; i++)
    22. /* 对未访问过的顶点调用DFS,若是连通图,只会执行一次 */
    23. if (!visited[i])
    24. DFS(GL, i);
    25. }

    对比两个不同存储结构的深度优先遍历算法,对于n个顶点e条边的图来说,邻接矩阵由于是二维数组,要查找每个顶点的邻接点需要访问矩阵中的所有元素,因此都需要O(n2)的时间。而邻接表做存储结构时,找邻接点所需的时间取决于顶点和边的数量,所以是O(n+e)。显然对于点多边少的稀疏图来说,邻接表结构使得算法在时间效率上大大提高。

    对于有向图而言,由于它只是对通道存在可行或不可行,算法上没有变化,是完全可以通用的。这里就不再详述了。