2022/03 - 2022/03/02 js中的深度/广度优先遍历 - 《杂文》

深度优先遍历
广度优先遍历
总结

原文地址
2022/03/02 js中的深度/广度优先遍历 - 图1
深度遍历(DFS)和广度遍历(BFS)是数据结构遍历的两种常用方式，广泛运用在处理树形结构的数据类型，例如：处理目录、数据结构树形化、diff算法等等。DFS的处理逻辑如下（左）BFS如下（右）。
2022/03/02 js中的深度/广度优先遍历 - 图2 两种方式都会把整个节点走一遍，深度优先遍历是以分支为一条路线，处理逻辑为9 -> 5 -> 2 -> 6 -> 10 -> 7，可以发现规律是为触碰到某个分支的最后一个节点（这个节点下没有子节点），就会向上冒泡，形象的说就是：
只要我有下级，我就会被遍历，如果我没有下级，那么我隔壁的分支就会开始运作
广度优先遍历是以等级作为路线，处理逻辑为1 -> 2 -> 3 -> 4 -> 5，和深度优先遍历不同，广度优先遍历不关心是否有子节点，他只关心排队在当前节点后的那个节点是什么，形象的说就是：
我有下级我也不会往下走，我只想让我同级的节点排在我后面
弄清概念之后，下面开始code example，用比较常见的nodejs处理目录的例子来解释这两种遍历模式

深度优先遍历

以上面的gif为目录结构，做些改造，偷偷加两个文件：
/1
|---/2
|-------/5
|------------/9
|--------2.index.js
|---/3
|-------/6
|-------/7
|-----------/10
|---/4
|-------4.index.js
|-------/8
用深度优先遍历，把目录结构变成形如：
[
  { name: 1, children: [{ name: 2, children: [{ name: 5, children: [{ name: 9 }] }, { name: '2.index.js' }] }] },
  {
    name: 3,
    children: [
      { name: 6, children: [] },
      { name: 7, children: [] }
    ]
  },
  { name: 4, children: [{ name: '4.index.js' }, { name: 8, children: [] }] }
];

代码如下：

/*
 * 递归的处理逻辑，把处理路径传给递归处理函数
 * 如果这个路径类型是文件夹，那么创建children字段，并把目录push到children
 * 例如第一次生成的result => [{name: 9}]
 * 第二次遍历的目录5，要把上一次的name: 9 变成name: 5的 children 的一项
 * 做到处理每一个节点的关键是，我们每次递归都要把子目录的dir作为参数传下去
 */
function dfs(dir) {  
  const result = [];
  if (fs.statSync(dir).isDirectory()) {
    const dirs = fs.readdirSync(path.resolve(__dirname, dir));
    dirs.forEach(filename => {
      const curFilePath = dir + path.sep + filename;
      if (fs.statSync(curFilePath).isDirectory()) {
        const block = { name: filename, children: [] };
        block.children.push(...dfs(curFilePath));
        result.push(block);
      } else {
        result.push({ name: filename });
      }
    });
  }
  return result;
}
console.log(dfs('1'))

广度优先遍历

整个深度优先遍历，不仅使用了迭代计算（创建一个result数组作为命名空间）而且必须使用递归计算，递归比较耗性能和不稳定，在处理上述这类树形重组比较实用，当我们只需要找到每一个节点，或者对某些节点做一些操作，就可以优先使用广度优先遍历，例如上述例子，找出目录中的所有.js文件：

/**
 * bfs会把节点拍平，添加到数组末
 * 每次操作完，会把这一项去掉
 * 整个流程是先添加，再处理，处理完成就删除
 */
function bfs(dir) {
  const stack = [];
  if (fs.statSync(dir).isDirectory()) {
    const dirs = fs.readdirSync(path.resolve(__dirname, dir));
    dirs.forEach(filename => {
      stack.push(dir + path.sep + filename);
    });
    while (stack.length) {
      const item = stack.shift();
      if (path.extname(item) === '.js') {
        console.log(item);
      }
      if (fs.statSync(item).isDirectory()) {
        stack.push(...fs.readdirSync(path.resolve(__dirname, item)).map(file => item + path.sep + file));
      }
    }
  }
}
bfs('1'); // 输出 1/2/2.index.js 和 1/4/4.index.js

总结

本文抛砖引玉的介绍了两种常见的遍历模式，在选择上如果是case1这种结构重组，建议使用深度优先，如果只是数据提取或修改，建议使用广度优先避免递归带来的麻烦。