Nodejs 进阶 - 使用 Node.js 结合异步迭代器实现可读流到可写流的数据复制 - 《Nodejs技术栈》

数据写入方法实现
结合异步迭代器实现

默认文件1627910902075.png
实现可读流到可写流数据复制，就是不断的读取->写入这个过程，那么你首先想到的是不是下面这样呢？代码看似很简单，结果却是很糟糕的，没有任何的数据积压处理。如果读取的文件很大了，造成的后果就是缓冲区数据溢出，程序会占用过多的系统内存，拖垮服务器上的其它应用，如果不明白的回顾下这篇文章 Node.js Stream 背压 — 消费端数据积压来不及处理会怎么样？。

// 糟糕的示例，没有数据积压处理
readable.on('data', data => {
  writable.write(data)
});

类似以上的需求，推荐你用 pipe() 方法以流的形式完成数据的复制。作为学习，本文介绍如何自定义一个 myCopy(src, dest) 方法实现从数据源到目标源的数据复制。

数据写入方法实现

_write 方法目的是控制可写流的数据写入，它返回一个 Promise 对象，如果可写流的 dest.write() 方法返回 true，表示内部缓冲区未满，继续写入。

当 dest.write() 方法返回 false 表示向流中写入数据超过了它所能处理的最大能力限制，此时暂停向流中写入数据，直到 drain 事件触发，表示缓冲区中的数据已排空了可以继续写入，再将 Promise 对象变为解决。

function _write(dest, chunk) {
  return new Promise(resolve => {
    if (dest.write(chunk)) {
      return resolve(null);
    }
    dest.once('drain', resolve);
  })  
}

结合异步迭代器实现

异步迭代器使从可读流对象读取数据变得更简单，异步的读取数据并调用我们封装的 _write(chunk) 方法写入数据，如果缓冲区空间已满，这里 await _write(dest, chunk) 也会等待，当缓冲区有空间可以继续写入了，再次进行读取 -> 写入。

function myCopy(src, dest) {
  return new Promise(async (resolve, reject) => {
    dest.on('error', reject);
    try {
      for await (const chunk of src) {
        await _write(dest, chunk);
      }
      resolve();
    } catch (err) {
      reject(err);
    }
  });
}

使用如下所示：

const readable = fs.createReadStream('text.txt');
const writable = fs.createWriteStream('dest-text.txt');
await myCopy(readable, writable);