默认文件1611584190434.png

作者简介:五月君,Software Designer,公众号「Nodejs技术栈」作者。

Async Hooks 一个实际的使用场景是存储请求上下文,在异步调用之间共享数据。上节对基础使用做了介绍,还没看的参见之前的分享 使用 Node.js 的 Async Hooks 模块追踪异步资源

本节将会介绍如何基于 Async hooks 提供的 API 从零开始实现一个 AsyncLocalStorage 类(异步本地存储)及在 HTTP 请求中关联日志的 traceId 实现链路追踪,这也是 Async Hooks 的一个实际应用场景了。

何为异步本地存储?

我们所说的异步本地存储类似于多线程编程语言中的线程本地存储。拿之前笔者写过的 Java 做个举例,例如 Java 中的 ThreadLocal 类,可以为使用相同变量的不同线程创建一个各自的副本,避免共享资源产生的冲突,在一个线程请求之内通过 get()/set() 方法获取或设置这个变量在当前线程中对应的副本值,在多线程并发访问时线程之间各自创建的副本互不影响。

在 Node.js 中我们的业务通常都工作在主线程(使用 work_threads 除外),是没有 ThreadLocal 类的。并且以事件驱动的方式来处理所有的 HTTP 请求,每个请求过来之后又都是异步的,异步之间还很难去追踪上下文信息,我们想做的是在这个异步事件开始,例如从接收 HTTP 请求到响应,能够有一种机可以让我们随时随地去获取在这期间的一些共享数据,也就是我们本节所提的异步本地存储技术。

在接下来我会讲解实现 AsyncLocalStorage 的四种方式,从最开始的手动实现到官方 v14.x 支持的 AsyncLocalStorage 类,你也可以从中学习到其实现原理。

现有业务问题

假设,现在有一个需求对现有日志系统做改造,所有记录日志的地方增加 traceId 实现全链路日志追踪。

一种情况是假设你使用一些类似 Egg.js 这样的企业级框架,可以依赖于框架提供的中间件能力在请求上挂载 traceId,可以看看之前的一篇文章 基于 Egg.js 框架的日志链路追踪实践 也是可以实现的,不过当时是基于 egg 的一个插件自己做了继承实现,现在已经不需要这么麻烦,可以通过配置自定义日志格式来实现 https://eggjs.org/zh-cn/core/logger.html#自定义日志格式

另一种情况假设你是用的 Express、Koa 这些基础框架,所有业务都是模块加载函数式调用,如果每次把请求的 traceId 手动在 Controller -> Service -> Model 之间传递,这样对业务代码的侵入太大了,日志与业务的耦合度就太高了。

如下代码,是我精简后的一个例子,现在有一个需求,在不更改业务代码的情况下每次日志打印都输出当前 HTTP 请求处理 Headers 中携带的 traceId 字段,如果是你会怎么做呢?

  1. // logger.js
  2. const logger = {
  3. info: (...args) => {
  4. console.log(...args);
  5. }
  6. }
  7. module.exports = { logger }
  8. // app.js
  9. const express = require('express');
  10. const app = express();
  11. const PORT = 3000;
  12. const { logger } = require('./logger');
  13. global.logger = contextLogger;
  14. app.use((req, res, next) => contextLogger.run(req, next));
  15. app.get('/logger', async (req, res, next) => {
  16. try {
  17. const users = await getUsersController();
  18. res.json({ code: 'SUCCESS', message: '', data: users });
  19. } catch (error) {
  20. res.json({ code: 'ERROR', message: error.message })
  21. }
  22. });
  23. app.listen(PORT, () => console.log(`server is listening on ${PORT}`));
  24. async function getUsersController() {
  25. logger.info('Get user list at controller layer.');
  26. return getUsersService();
  27. }
  28. async function getUsersService() {
  29. logger.info('Get user list at service layer.');
  30. setTimeout(function() { logger.info('setTimeout 2s at service layer.') }, 3000);
  31. return getUsersModel();
  32. }
  33. async function getUsersModel() {
  34. logger.info('Get user list at model layer.');
  35. return [];
  36. }

方式一:动手实现异步本地存储

解决方案是实现请求上下文本地存储,在当前作用域代码中能够获取上下文信息,待处理完毕清除保存的上下文信息,这些需求可以通过 Async Hooks 提供的 API 实现。

创建 AsyncLocalStorage 类

  • 行 {1} 创建一个 Map 集合存储上下文信息。
  • 行 {2} 里面的 init 回调是重点,当一个异步事件被触发前会先收到 init 回调,其中 triggerAsyncId 是当前异步资源的触发者,我们则可以在这里获取上个异步资源的信息存储至当前异步资源中。当 asyncId 对应的异步资源被销毁时会收到 destroy 回调,所以最后要记得在 destroy 回调里清除当前 asyncId 里存储的信息
  • 行 {3} 拿到当前请求上下文的 asyncId 做为 Map 集合的 Key 存入传入的上下文信息。
  • 行 {4} 拿到 asyncId 获取当前代码的上下文信息。
  1. // AsyncLocalStorage.js
  2. const asyncHooks = require('async_hooks');
  3. const { executionAsyncId } = asyncHooks;
  4. class AsyncLocalStorage {
  5. constructor() {
  6. this.storeMap = new Map(); // {1}
  7. this.createHook(); // {2}
  8. }
  9. createHook() {
  10. const ctx = this;
  11. const hooks = asyncHooks.createHook({
  12. init(asyncId, type, triggerAsyncId) {
  13. if (ctx.storeMap.has(triggerAsyncId)) {
  14. ctx.storeMap.set(asyncId, ctx.storeMap.get(triggerAsyncId));
  15. }
  16. },
  17. destroy(asyncId) {
  18. ctx.storeMap.delete(asyncId);
  19. }
  20. });
  21. hooks.enable();
  22. }
  23. run(store, callback) { // {3}
  24. this.storeMap.set(executionAsyncId(), store);
  25. callback();
  26. }
  27. getStore() { // {4}
  28. return this.storeMap.get(executionAsyncId());
  29. }
  30. }
  31. module.exports = AsyncLocalStorage;

注意,在我们定义的 createHook() 方法里有 hooks.enable(); 这样一段代码,这是因为 Promise 默认是没有开启的,通过显示的调用可以开启 Promise 的异步追踪。

改造 logger.js 文件

在我们需要打印日志的地方拿到当前代码所对应的上下文信息,取出我们存储的 traceId, 这种方式只需要改造我们日志中间即可,不需要去更改我们的业务代码。

  1. const { v4: uuidV4 } = require('uuid');
  2. const AsyncLocalStorage = require('./AsyncLocalStorage');
  3. const asyncLocalStorage = new AsyncLocalStorage();
  4. const logger = {
  5. info: (...args) => {
  6. const traceId = asyncLocalStorage.getStore();
  7. console.log(traceId, ...args);
  8. },
  9. run: (req, callback) => {
  10. asyncLocalStorage.run(req.headers.requestId || uuidV4(), callback);
  11. }
  12. }
  13. module.exports = {
  14. logger,
  15. }

改造 app.js 文件

注册一个中间件,传递请求信息。

  1. app.use((req, res, next) => logger.run(req, next));

运行后输出结果

  1. e82d1a1f-5038-4ac9-a9c8-2aa5abb0f96a Get user list at router layer.
  2. e82d1a1f-5038-4ac9-a9c8-2aa5abb0f96a Get user list at controller layer.
  3. e82d1a1f-5038-4ac9-a9c8-2aa5abb0f96a Get user list at service layer.
  4. e82d1a1f-5038-4ac9-a9c8-2aa5abb0f96a Get user list at model layer.
  5. e82d1a1f-5038-4ac9-a9c8-2aa5abb0f96a setTimeout 2s at service layer.

这种方式就是完全基于 Async Hooks 提供的 API 来实现,不理解其实现原理的可以在动手实践下,这种方式需要我们额外维护维护一个 Map 对象,还要处理销毁操作。

方式二:利用 executionAsyncResource() 返回当前执行的异步资源

executionAsyncResource() 返回当前执行的异步资源,这对于实现连续的本地存储很有帮助,无需像 “方式一” 再创建一个 Map 对象来存储元数据。

  1. const asyncHooks = require('async_hooks');
  2. const { executionAsyncId, executionAsyncResource } = asyncHooks;
  3. class AsyncLocalStorage {
  4. constructor() {
  5. this.createHook();
  6. }
  7. createHook() {
  8. const hooks = asyncHooks.createHook({
  9. init(asyncId, type, triggerAsyncId, resource) {
  10. const cr = executionAsyncResource();
  11. if (cr) {
  12. resource[asyncId] = cr[triggerAsyncId];
  13. }
  14. }
  15. });
  16. hooks.enable();
  17. }
  18. run(store, callback) {
  19. executionAsyncResource()[executionAsyncId()] = store;
  20. callback();
  21. }
  22. getStore() {
  23. return executionAsyncResource()[executionAsyncId()];
  24. }
  25. }
  26. module.exports = AsyncLocalStorage;

方式三:基于 ResourceAsync 创建 AsyncLocalStorage 类

ResourceAysnc 可以用来自定义异步资源,此处的介绍也是参考 Node.js 源码对 AsyncLocalStorage 的实现。

一个显著的改变是 run() 方法,每一次的调用都会创建一个资源,调用其 runInAsyncScope() 方法,这样在这个资源的异步作用域下,所执行的代码(传入的 callback)都是可追踪我们设置的 store。

  1. const asyncHooks = require('async_hooks');
  2. const { executionAsyncResource, AsyncResource } = asyncHooks;
  3. class AsyncLocalStorage {
  4. constructor() {
  5. this.kResourceStore = Symbol('kResourceStore');
  6. this.enabled = false;
  7. const ctx = this;
  8. this.hooks = asyncHooks.createHook({
  9. init(asyncId, type, triggerAsyncId, resource) {
  10. const currentResource = executionAsyncResource();
  11. ctx._propagate(resource, currentResource)
  12. }
  13. });
  14. }
  15. // Propagate the context from a parent resource to a child one
  16. _propagate(resource, triggerResource) {
  17. const store = triggerResource[this.kResourceStore];
  18. if (store) {
  19. resource[this.kResourceStore] = store;
  20. }
  21. }
  22. _enable() {
  23. if (!this.enabled) {
  24. this.enabled = true;
  25. this.hooks.enable();
  26. }
  27. }
  28. enterWith(store) {
  29. this._enable();
  30. const resource = executionAsyncResource();
  31. resource[this.kResourceStore] = store;
  32. }
  33. run(store, callback) {
  34. const resource = new AsyncResource('AsyncLocalStorage', {
  35. requireManualDestroy: true,
  36. });
  37. return resource.emitDestroy().runInAsyncScope(() => {
  38. this.enterWith(store);
  39. return callback();
  40. });
  41. }
  42. getStore() {
  43. return executionAsyncResource()[this.kResourceStore];
  44. }
  45. }
  46. module.exports = AsyncLocalStorage;

方式四:Node.js 官方提供的 AsyncLocalStorage 类

Node.js v13.10.0 async_hooks 模块新加入了 AsyncLocalStorage 类,实例化一个对象调用 run() 方法实现本地存储,也是推荐的方式,不需要自己去再额外维护一个 AsyncLocalStorage 类。

AsyncLocalStorage 类的实现也就是上面讲解的方式三,所以也不需要我们在外部显示的调用 hooks.enable() 来启用 Promise 异步追踪,因为其内部已经实现了。

  1. const { AsyncLocalStorage } = require('async_hooks');

Async Hooks 的性能开销

这一点是大家最关心的问题,如果开启了 Async Hooks(Promise 需要调用 Async Hooks 实例的 enable() 方法开启)每一次异步操作或 Promise 类型的操作,包括 console 只要是异步的都会触发 hooks,也必然是有性能开销的。

参考 Kuzzle 的性能基准测试,使用了 AsyncLocalStorage 与未使用之间相差 ~8%。

—— Log with AsyncLocalStorage Log classic difference
req/s 2613 2842 〜8%

当然不同的业务也有着不同的差异,如果你担心会有很大的性能开销,可以基于自己的业务做一些基准测试。

Reference