node源码分析 - 11-setImmediate和nextTick - 《技术》

11.1 setImmediate
11.2 nextTick

setImmediate对应Libuv的check阶段。所提交的任务会在Libuv事件循环的check阶段被执行，check阶段的任务会在每一轮事件循环中被执行，但是setImmediate提交的任务只会执行一次，下面我们会看到Node.js是怎么处理的，我们看一下具体的实现。

11.1 setImmediate

11.1.1设置处理immediate任务的函数

在Node.js初始化的时候，设置了处理immediate任务的函数

    // runNextTicks用于处理nextTick产生的任务，这里不关注  
    const { processImmediate, processTimers } = getTimerCallbacks(runNextTicks);  
    setupTimers(processImmediate, processTimers);

我们先看看一下setupTimers（timer.cc）的逻辑。

    void SetupTimers(const FunctionCallbackInfo<Value>& args) {  
      auto env = Environment::GetCurrent(args);  
      env->set_immediate_callback_function(args[0].As<Function>());  
      env->set_timers_callback_function(args[1].As<Function>());  
    }

SetupTimers在env中保存了两个函数processImmediate, processTimers，processImmediate是处理immediate任务的，processTimers是处理定时器任务的，在定时器章节我们已经分析过。

11.1.2 注册check阶段的回调

在Node.js初始化的时候，同时初始化了immediate任务相关的数据结构和逻辑。

    void Environment::InitializeLibuv(bool start_profiler_idle_notifier) { 
      // 初始化immediate相关的handle 
      uv_check_init(event_loop(), immediate_check_handle());  
      // 修改状态为unref，避免没有任务的时候，影响事件循环的退出  
      uv_unref(reinterpret_cast<uv_handle_t*>(immediate_check_handle()));  
      // 激活handle，设置回调
      uv_check_start(immediate_check_handle(), CheckImmediate);  
      // 在idle阶段也插入一个相关的节点  
      uv_idle_init(event_loop(), immediate_idle_handle());  
    }

Node.js默认会往check阶段插入一个节点，并设置回调为CheckImmediate，但是初始化状态是unref的，所以如果没有immediate任务的话，不会影响事件循环的退出。我们看一下CheckImmediate函数

    void Environment::CheckImmediate(uv_check_t* handle) {  
      // 省略部分代码  
      // 没有Immediate节点需要处理  
      if (env->immediate_info()->count() == 0 || 
             !env->can_call_into_js())  
        return;  
      do {  
        // 执行JS层回调immediate_callback_function  
        MakeCallback(env->isolate(),  
                     env->process_object(),  
                     env->immediate_callback_function(), 
                     0,  
                     nullptr,  
                     {0, 0}).ToLocalChecked();  
      } while (env->immediate_info()->has_outstanding() && 
                   env->can_call_into_js());  
      /* 
            所有immediate节点都处理完了，置idle阶段对应节点为非激活状态，
            允许Poll IO阶段阻塞和事件循环退出  
        */
      if (env->immediate_info()->ref_count() == 0)  
        env->ToggleImmediateRef(false);  
    }

我们看到每一轮事件循环时，CheckImmediate都会被执行，但是如果没有需要处理的任务则直接返回。如果有任务，CheckImmediate函数执行immediate_callback_function函数，这正是Node.js初始化的时候设置的函数processImmediate。看完初始化和处理immediate任务的逻辑后，我们看一下如何产生一个immediate任务。

11.1.3 setImmediate生成任务

我们可以通过setImmediate生成一个任务。

    function setImmediate(callback, arg1, arg2, arg3) {  
      let i, args;  
      switch (arguments.length) {  
        case 1:  
          break;  
        case 2:  
          args = [arg1];  
          break;  
        case 3:  
          args = [arg1, arg2];  
          break;  
        default:  
          args = [arg1, arg2, arg3];  
          for (i = 4; i < arguments.length; i++) {  
            args[i - 1] = arguments[i];  
          }  
          break;  
      }  
      return new Immediate(callback, args);  
    }

setImmediate的代码比较简单，新建一个Immediate。我们看一下Immediate的类。

    const Immediate = class Immediate {  
      constructor(callback, args) {  
        this._idleNext = null;  
        this._idlePrev = null;  
        this._onImmediate = callback;  
        this._argv = args;  
        this._destroyed = false;  
        this[kRefed] = false;    
        this.ref();  
        // Immediate链表的节点个数，包括ref和unref状态  
        immediateInfo[kCount]++;  
        // 加入链表中  
        immediateQueue.append(this);  
      }  
      // 打上ref标记，往Libuv的idle链表插入一个激活状态的节点，如果还没有的话  
      ref() {    
        if (this[kRefed] === false) {  
          this[kRefed] = true;  
          if (immediateInfo[kRefCount]++ === 0)  
            toggleImmediateRef(true);  
        }  
        return this;  
      }  
      // 和上面相反  
      unref() {  
        if (this[kRefed] === true) {  
          this[kRefed] = false;  
          if (--immediateInfo[kRefCount] === 0)  
            toggleImmediateRef(false);  
        }  
        return this;  
      }  
      hasRef() {  
        return !!this[kRefed];  
      }  
    };

Immediate类主要做了两个事情。

1 生成一个节点插入到链表。

    const immediateQueue = new ImmediateList();  
    // 双向非循环的链表  
    function ImmediateList() {  
      this.head = null;  
      this.tail = null;  
    }  
    ImmediateList.prototype.append = function(item) {  
      // 尾指针非空，说明链表非空，直接追加在尾节点后面  
      if (this.tail !== null) {  
        this.tail._idleNext = item;  
        item._idlePrev = this.tail;  
      } else {  
        // 尾指针是空说明链表是空的，头尾指针都指向item  
        this.head = item;  
      }  
      this.tail = item;  
    };  
    ImmediateList.prototype.remove = function(item) {  
      // 如果item在中间则自己全身而退，前后两个节点连上  
      if (item._idleNext !== null) {  
        item._idleNext._idlePrev = item._idlePrev;  
      }  
      if (item._idlePrev !== null) {  
        item._idlePrev._idleNext = item._idleNext;  
      }  
      // 是头指针，则需要更新头指针指向item的下一个，因为item被删除了，尾指针同理  
      if (item === this.head)  
        this.head = item._idleNext;  
      if (item === this.tail)  
        this.tail = item._idlePrev;  
      // 重置前后指针  
      item._idleNext = null;  
      item._idlePrev = null;  
    };

2 如果还没有往Libuv的idle链表里插入一个激活节点的话，则插入一个。从之前的分析，我们知道，Node.js在check阶段插入了一个unref节点，在每次check阶段都会执行该节点的回调，那么这个idle节点有什么用呢？答案在uv_backend_timeout函数中，uv_backend_timeout定义了Poll IO阻塞的时长，如果有ref状态的idle节点则Poll IO阶段不会阻塞（但是不会判断是否有check节点）。所以当有immediate任务时，Node.js会把这个idle插入idle阶段中，表示有任务处理，不能阻塞Poll IO阶段。没有immediate任务时，则移除idle节点。总的来说，idle节点的意义是标记是否有immediate任务需要处理，有的话就不能阻塞Poll IO阶段，并且不能退出事件循环。

    void ToggleImmediateRef(const FunctionCallbackInfo<Value>& args) { 
      Environment::GetCurrent(args)->ToggleImmediateRef(args[0]->IsTrue())
    }  
    void Environment::ToggleImmediateRef(bool ref) {  
      if (started_cleanup_) return;  
      // 改变handle的状态（激活或不激活），防止在Poll IO阶段阻塞  
      if (ref) { 
        uv_idle_start(immediate_idle_handle(), [](uv_idle_t*){ });  
      } else {  
            // 不阻塞Poll IO，允许事件循环退出
        uv_idle_stop(immediate_idle_handle());  
      }  
    }

这是setImmediate函数的整个过程。和定时器一样，我们可以调用immediate任务的ref和unref函数，控制它对事件循环的影响。

11.1.4 处理setImmediate产生的任务

最后我们看一下在check阶段时，是如何处理immediate任务的。由前面分析我们知道processImmediate函数是处理immediate任务的函数，来自getTimerCallbacks（internal/timer.js）。

    function processImmediate() {  
       /*
           上次执行processImmediate的时候如果由未捕获的异常，
           则outstandingQueue保存了未执行的节点，下次执行processImmediate的时候，
           优先执行outstandingQueue队列的节点  
       */
       const queue = outstandingQueue.head !== null ?  
         outstandingQueue : immediateQueue;  
       let immediate = queue.head;  
       /* 
         在执行immediateQueue队列的话，先置空队列，避免执行回调
             的时候一直往队列加节点，死循环。 所以新加的接口会插入新的队列，
             不会在本次被执行。并打一个标记,全部immediateQueue节点都被执
             行则清空，否则会再执行processImmediate一次，见Environment::CheckImmediate 
       */  
       if (queue !== outstandingQueue) {  
         queue.head = queue.tail = null;  
         immediateInfo[kHasOutstanding] = 1;  
       }  
       let prevImmediate;  
       let ranAtLeastOneImmediate = false;  
       while (immediate !== null) {  
         // 执行微任务  
         if (ranAtLeastOneImmediate)  
           runNextTicks();  
         else  
           ranAtLeastOneImmediate = true;  
         // 微任务把该节点删除了，则不需要指向它的回调了，继续下一个  
         if (immediate._destroyed) {  
           outstandingQueue.head = immediate = prevImmediate._idleNext;  
           continue;  
         }  
         immediate._destroyed = true;  
         // 执行完要修改个数  
         immediateInfo[kCount]--;  
         if (immediate[kRefed])  
           immediateInfo[kRefCount]--;  
         immediate[kRefed] = null;  
         // 见上面if (immediate._destroyed)的注释  
         prevImmediate = immediate;  
         // 执行回调，指向下一个节点  
         try {  
           const argv = immediate._argv;  
           if (!argv)  
             immediate._onImmediate();  
           else  
             immediate._onImmediate(...argv);  
         } finally {  
           immediate._onImmediate = null;  
           outstandingQueue.head = immediate = immediate._idleNext;  
         }  
       }  
       // 当前执行的是outstandingQueue的话则把它清空  
       if (queue === outstandingQueue)  
         outstandingQueue.head = null;  
       // 全部节点执行完  
       immediateInfo[kHasOutstanding] = 0;  
     }

processImmediate的逻辑就是逐个执行immediate任务队列的节点。Immediate分两个队列，正常情况下，插入的immediate节点插入到immediateQueue队列。如果执行的时候有异常，则未处理完的节点就会被插入到outstandingQueue队列，等下一次执行。另外我们看到runNextTicks。runNextTicks在每执行完immediate节点后，都先处理tick任务然后再处理下一个immediate节点。

11.1.5 Node.js的setTimeout(fn,0)和setImmediate谁先执行的问题

我们首先看一下下面这段代码

    setTimeout(()=>{ console.log('setTimeout'); },0)  
    setImmediate(()=>{ console.log('setImmedate');})

我们执行上面这段代码，会发现输出是不确定的。下面来看一下为什么。Node.js的事件循环分为几个阶段(phase)。setTimeout是属于定时器阶段，setImmediate是属于check阶段。顺序上定时器阶段是比check更早被执行的。其中setTimeout的实现代码里有一个很重要的细节。

    after *= 1; // coalesce to number or NaN  
      if (!(after >= 1 && after <= TIMEOUT_MAX)) {  
        if (after > TIMEOUT_MAX) {  
          process.emitWarning(`错误提示`);  
        }  
        after = 1; // schedule on next tick, follows browser behavior  
      }

我们发现虽然我们传的超时时间是0，但是0不是合法值，Node.js会把超时时间变成1。这就是导致上面的代码输出不确定的原因。我们分析一下这段代码的执行过程。Node.js启动的时候，会编译执行上面的代码，开始一个定时器，挂载一个setImmediate节点在队列。然后进入Libuv的事件循环，然后执行定时器阶段，Libuv判断从开启定时器到现在是否已经过去了1毫秒，是的话，执行定时器回调，否则执行下一个节点，执行完其它阶段后，会执行check阶段。这时候就会执行setImmediate的回调。所以，一开始的那段代码的输出结果是取决于启动定时器的时间到Libuv执行定时器阶段是否过去了1毫秒。

11.2 nextTick

nextTick用于异步执行一个回调函数，和setTimeout、setImmediate类似，不同的地方在于他们的执行时机，setTimeout和setImmediate的任务属于事件循环的一部分，但是nextTick的任务不属于事件循环的一部分，具体的执行时机我们会在本节分析。

11.2.1 初始化nextTick

nextTick函数是在Node.js启动过程中，在执行bootstrap/node.js时挂载到process对象中。

    const { nextTick, runNextTicks } = setupTaskQueue();  
    process.nextTick = nextTick;  
    // 真正的定义在task_queues.js。
    setupTaskQueue() {   
      setTickCallback(processTicksAndRejections);  
      return {  
        nextTick,  
      };  
    },

nextTick接下来会讲，setTickCallback是注册处理tick任务的函数，

    static void SetTickCallback(const FunctionCallbackInfo<Value>& args) {  
      Environment* env = Environment::GetCurrent(args);  
      CHECK(args[0]->IsFunction());  
      env->set_tick_callback_function(args[0].As<Function>());  
    }

只是简单地保存处理tick任务的函数。后续会用到

11.2.2 nextTick生产任务

    function nextTick(callback) {  
      let args;  
      switch (arguments.length) {  
        case 1: break;  
        case 2: args = [arguments[1]]; break;  
        case 3: args = [arguments[1], arguments[2]]; break;  
        case 4: args = [arguments[1], arguments[2], arguments[3]]; break;  
        default:  
          args = new Array(arguments.length - 1);  
          for (let i = 1; i < arguments.length; i++)  
            args[i - 1] = arguments[i];  
      }  
      // 第一个任务，开启tick处理逻辑  
      if (queue.isEmpty())  
        setHasTickScheduled(true);  
      const asyncId = newAsyncId();  
      const triggerAsyncId = getDefaultTriggerAsyncId();  
      const tickObject = {  
        [async_id_symbol]: asyncId,  
        [trigger_async_id_symbol]: triggerAsyncId,  
        callback,  
        args  
      };  
      // 插入队列  
      queue.push(tickObject);  
    }

这就是我们执行nextTick时的逻辑。每次调用nextTick都会往队列中追加一个节点。

11.2.3 处理tick任务

我们再看一下处理的tick任务的逻辑。Nodejs在初始化时，通过执行setTickCallback(processTicksAndRejections)注册了处理tick任务的函数。Node.js在初始化时把处理tick任务的函数保存到env中。另外，Nodejs使用TickInfo类管理tick的逻辑。

    class TickInfo : public MemoryRetainer {  
     public:  
      inline AliasedUint8Array& fields();  
      inline bool has_tick_scheduled() const;  
      inline bool has_rejection_to_warn() const;  
     private:  
      inline explicit TickInfo(v8::Isolate* isolate);  
      enum Fields { kHasTickScheduled = 0, kHasRejectionToWarn, kFieldsCount };  
      AliasedUint8Array fields_;  
    };

TickInfo主要是有两个标记位，kHasTickScheduled标记是否有tick任务需要处理。然后通过InternalCallbackScope类的对象方法Close函数执行tick_callback_function。当Nodejs底层需要执行一个js回调时，会调用AsyncWrap的MakeCallback。MakeCallback里面调用了InternalMakeCallback。

    MaybeLocal<Value> InternalMakeCallback(Environment* env, Local<Object> recv, 
    const Local<Function> callback, int argc, Local<Value> argv[],
    async_context asyncContext) {  
      InternalCallbackScope scope(env, recv, asyncContext);  
      // 执行用户层js回调  
      scope.Close();  
      return ret;  
    }

我们看InternalCallbackScope 的Close

    void InternalCallbackScope::Close() {  
      // 省略部分代码  
      TickInfo* tick_info = env_->tick_info();  
      // 没有tick任务则不需要往下走，在插入tick任务的时候会设置这个为true，没有任务时变成false  
      if (!tick_info->has_tick_scheduled() && !tick_info->has_rejection_to_warn()) {  
        return;  
      }  
      HandleScope handle_scope(env_->isolate());  
      Local<Object> process = env_->process_object();  
      if (!env_->can_call_into_js()) return;  
      // 处理tick的函数  
      Local<Function> tick_callback = env_->tick_callback_function();  
      // 处理tick任务  
      if (tick_callback->Call(env_->context(), process, 0, nullptr).IsEmpty()) {  
        failed_ = true;  
      }  
    }

我们看到每次执行js层的回调的时候，就会处理tick任务。Close函数可以主动调用，或者在InternalCallbackScope对象析构的时候被调用。除了执行js回调时是主动调用Close外，一般处理tick任务的时间点就是在InternalCallbackScope对象被析构的时候。所以在定义了InternalCallbackScope对象的时候，一般就会在对象析构的时候，进行tick任务的处理。另外一种就是在执行的js回调里，调用runNextTicks处理tick任务。比如执行immediate任务的过程中。

    function runNextTicks() {  
      if (!hasTickScheduled() && !hasRejectionToWarn())  
        runMicrotasks();  
      if (!hasTickScheduled() && !hasRejectionToWarn())  
        return;  
      processTicksAndRejections();  
    }

我们看processTicksAndRejections是如何处理tick任务的。

    function processTicksAndRejections() {  
      let tock;  
      do {  
        while (tock = queue.shift()) {  
          const asyncId = tock[async_id_symbol];  
          emitBefore(asyncId, tock[trigger_async_id_symbol]);  
          try {  
            const callback = tock.callback;  
            if (tock.args === undefined) {  
              callback();  
            } else {  
              const args = tock.args;  
              switch (args.length) {  
                case 1: callback(args[0]); break;  
                case 2: callback(args[0], args[1]); break;  
                case 3: callback(args[0], args[1], args[2]); break;  
                case 4: callback(args[0], args[1], args[2], args[3]); break;  
                default: callback(...args);  
              }  
            }  
          } finally {  
            if (destroyHooksExist())  
              emitDestroy(asyncId);  
          }  
          emitAfter(asyncId);  
        }  
        runMicrotasks();  
      } while (!queue.isEmpty() || processPromiseRejections());  
      setHasTickScheduled(false);  
      setHasRejectionToWarn(false);  
    }

从processTicksAndRejections代码中，我们可以看到，Node.js是实时从任务队列里取节点执行的，所以如果我们在nextTick的回调里一直调用nextTick的话，就会导致死循环。

    function test() {  
      process.nextTick(() => {  
        console.log(1);  
        test()  
      });  
    }  
    test();  
    setTimeout(() => {  
     console.log(2)  
    }, 10)

上面的代码中，会一直输出1，不会输出2。而在Nodejs源码的很多地方都处理了这个问题，首先把要执行的任务队列移到一个变量q2中，清空之前的队列q1。接着遍历q2指向的队列，如果执行回调的时候又新增了节点，只会加入到q1中。q2不会导致死循环。

11.2.4 nextTick的使用

我们知道nextTick可用于延迟执行一些逻辑，我们看一下哪些场景下可以使用nextTick。

    const { EventEmitter } = require('events');  
    class DemoEvents extends EventEmitter {  
      constructor() {  
        super();  
        this.emit('start');  
      }  
    }  
    const demoEvents = new DemoEvents();  
    demoEvents.on('start', () => {  
      console.log('start');  
    });

以上代码在构造函数中会触发start事件，但是事件的注册却在构造函数之后执行，而在构造函数之前我们还没有拿到DemoEvents对象，无法完成事件的注册。这时候，我们就可以使用nextTick。

    const { EventEmitter } = require('events');  
    class DemoEvents extends EventEmitter {  
      constructor() {  
        super();  
        process.nextTick(() => {  
          this.emit('start');  
        })  
      }  
    }  
    const demoEvents = new DemoEvents();  
    demoEvents.on('start', () => {  
      console.log('start');  
    });