setImmediate对应Libuv的check阶段。所提交的任务会在Libuv事件循环的check阶段被执行,check阶段的任务会在每一轮事件循环中被执行,但是setImmediate提交的任务只会执行一次,下面我们会看到Node.js是怎么处理的,我们看一下具体的实现。
11.1 setImmediate
11.1.1设置处理immediate任务的函数
在Node.js初始化的时候,设置了处理immediate任务的函数
// runNextTicks用于处理nextTick产生的任务,这里不关注
const { processImmediate, processTimers } = getTimerCallbacks(runNextTicks);
setupTimers(processImmediate, processTimers);
我们先看看一下setupTimers(timer.cc)的逻辑。
void SetupTimers(const FunctionCallbackInfo<Value>& args) {
auto env = Environment::GetCurrent(args);
env->set_immediate_callback_function(args[0].As<Function>());
env->set_timers_callback_function(args[1].As<Function>());
}
SetupTimers在env中保存了两个函数processImmediate, processTimers,processImmediate是处理immediate任务的,processTimers是处理定时器任务的,在定时器章节我们已经分析过。
11.1.2 注册check阶段的回调
在Node.js初始化的时候,同时初始化了immediate任务相关的数据结构和逻辑。
void Environment::InitializeLibuv(bool start_profiler_idle_notifier) {
// 初始化immediate相关的handle
uv_check_init(event_loop(), immediate_check_handle());
// 修改状态为unref,避免没有任务的时候,影响事件循环的退出
uv_unref(reinterpret_cast<uv_handle_t*>(immediate_check_handle()));
// 激活handle,设置回调
uv_check_start(immediate_check_handle(), CheckImmediate);
// 在idle阶段也插入一个相关的节点
uv_idle_init(event_loop(), immediate_idle_handle());
}
Node.js默认会往check阶段插入一个节点,并设置回调为CheckImmediate,但是初始化状态是unref的,所以如果没有immediate任务的话,不会影响事件循环的退出。我们看一下CheckImmediate函数
void Environment::CheckImmediate(uv_check_t* handle) {
// 省略部分代码
// 没有Immediate节点需要处理
if (env->immediate_info()->count() == 0 ||
!env->can_call_into_js())
return;
do {
// 执行JS层回调immediate_callback_function
MakeCallback(env->isolate(),
env->process_object(),
env->immediate_callback_function(),
0,
nullptr,
{0, 0}).ToLocalChecked();
} while (env->immediate_info()->has_outstanding() &&
env->can_call_into_js());
/*
所有immediate节点都处理完了,置idle阶段对应节点为非激活状态,
允许Poll IO阶段阻塞和事件循环退出
*/
if (env->immediate_info()->ref_count() == 0)
env->ToggleImmediateRef(false);
}
我们看到每一轮事件循环时,CheckImmediate都会被执行,但是如果没有需要处理的任务则直接返回。如果有任务,CheckImmediate函数执行immediate_callback_function函数,这正是Node.js初始化的时候设置的函数processImmediate。看完初始化和处理immediate任务的逻辑后,我们看一下如何产生一个immediate任务。
11.1.3 setImmediate生成任务
我们可以通过setImmediate生成一个任务。
function setImmediate(callback, arg1, arg2, arg3) {
let i, args;
switch (arguments.length) {
case 1:
break;
case 2:
args = [arg1];
break;
case 3:
args = [arg1, arg2];
break;
default:
args = [arg1, arg2, arg3];
for (i = 4; i < arguments.length; i++) {
args[i - 1] = arguments[i];
}
break;
}
return new Immediate(callback, args);
}
setImmediate的代码比较简单,新建一个Immediate。我们看一下Immediate的类。
const Immediate = class Immediate {
constructor(callback, args) {
this._idleNext = null;
this._idlePrev = null;
this._onImmediate = callback;
this._argv = args;
this._destroyed = false;
this[kRefed] = false;
this.ref();
// Immediate链表的节点个数,包括ref和unref状态
immediateInfo[kCount]++;
// 加入链表中
immediateQueue.append(this);
}
// 打上ref标记,往Libuv的idle链表插入一个激活状态的节点,如果还没有的话
ref() {
if (this[kRefed] === false) {
this[kRefed] = true;
if (immediateInfo[kRefCount]++ === 0)
toggleImmediateRef(true);
}
return this;
}
// 和上面相反
unref() {
if (this[kRefed] === true) {
this[kRefed] = false;
if (--immediateInfo[kRefCount] === 0)
toggleImmediateRef(false);
}
return this;
}
hasRef() {
return !!this[kRefed];
}
};
Immediate类主要做了两个事情。
1 生成一个节点插入到链表。
const immediateQueue = new ImmediateList();
// 双向非循环的链表
function ImmediateList() {
this.head = null;
this.tail = null;
}
ImmediateList.prototype.append = function(item) {
// 尾指针非空,说明链表非空,直接追加在尾节点后面
if (this.tail !== null) {
this.tail._idleNext = item;
item._idlePrev = this.tail;
} else {
// 尾指针是空说明链表是空的,头尾指针都指向item
this.head = item;
}
this.tail = item;
};
ImmediateList.prototype.remove = function(item) {
// 如果item在中间则自己全身而退,前后两个节点连上
if (item._idleNext !== null) {
item._idleNext._idlePrev = item._idlePrev;
}
if (item._idlePrev !== null) {
item._idlePrev._idleNext = item._idleNext;
}
// 是头指针,则需要更新头指针指向item的下一个,因为item被删除了,尾指针同理
if (item === this.head)
this.head = item._idleNext;
if (item === this.tail)
this.tail = item._idlePrev;
// 重置前后指针
item._idleNext = null;
item._idlePrev = null;
};
2 如果还没有往Libuv的idle链表里插入一个激活节点的话,则插入一个。从之前的分析,我们知道,Node.js在check阶段插入了一个unref节点,在每次check阶段都会执行该节点的回调,那么这个idle节点有什么用呢?答案在uv_backend_timeout函数中,uv_backend_timeout定义了Poll IO阻塞的时长,如果有ref状态的idle节点则Poll IO阶段不会阻塞(但是不会判断是否有check节点)。所以当有immediate任务时,Node.js会把这个idle插入idle阶段中,表示有任务处理,不能阻塞Poll IO阶段。没有immediate任务时,则移除idle节点。总的来说,idle节点的意义是标记是否有immediate任务需要处理,有的话就不能阻塞Poll IO阶段,并且不能退出事件循环。
void ToggleImmediateRef(const FunctionCallbackInfo<Value>& args) {
Environment::GetCurrent(args)->ToggleImmediateRef(args[0]->IsTrue())
}
void Environment::ToggleImmediateRef(bool ref) {
if (started_cleanup_) return;
// 改变handle的状态(激活或不激活),防止在Poll IO阶段阻塞
if (ref) {
uv_idle_start(immediate_idle_handle(), [](uv_idle_t*){ });
} else {
// 不阻塞Poll IO,允许事件循环退出
uv_idle_stop(immediate_idle_handle());
}
}
这是setImmediate函数的整个过程。和定时器一样,我们可以调用immediate任务的ref和unref函数,控制它对事件循环的影响。
11.1.4 处理setImmediate产生的任务
最后我们看一下在check阶段时,是如何处理immediate任务的。由前面分析我们知道processImmediate函数是处理immediate任务的函数,来自getTimerCallbacks(internal/timer.js)。
function processImmediate() {
/*
上次执行processImmediate的时候如果由未捕获的异常,
则outstandingQueue保存了未执行的节点,下次执行processImmediate的时候,
优先执行outstandingQueue队列的节点
*/
const queue = outstandingQueue.head !== null ?
outstandingQueue : immediateQueue;
let immediate = queue.head;
/*
在执行immediateQueue队列的话,先置空队列,避免执行回调
的时候一直往队列加节点,死循环。 所以新加的接口会插入新的队列,
不会在本次被执行。并打一个标记,全部immediateQueue节点都被执
行则清空,否则会再执行processImmediate一次,见Environment::CheckImmediate
*/
if (queue !== outstandingQueue) {
queue.head = queue.tail = null;
immediateInfo[kHasOutstanding] = 1;
}
let prevImmediate;
let ranAtLeastOneImmediate = false;
while (immediate !== null) {
// 执行微任务
if (ranAtLeastOneImmediate)
runNextTicks();
else
ranAtLeastOneImmediate = true;
// 微任务把该节点删除了,则不需要指向它的回调了,继续下一个
if (immediate._destroyed) {
outstandingQueue.head = immediate = prevImmediate._idleNext;
continue;
}
immediate._destroyed = true;
// 执行完要修改个数
immediateInfo[kCount]--;
if (immediate[kRefed])
immediateInfo[kRefCount]--;
immediate[kRefed] = null;
// 见上面if (immediate._destroyed)的注释
prevImmediate = immediate;
// 执行回调,指向下一个节点
try {
const argv = immediate._argv;
if (!argv)
immediate._onImmediate();
else
immediate._onImmediate(...argv);
} finally {
immediate._onImmediate = null;
outstandingQueue.head = immediate = immediate._idleNext;
}
}
// 当前执行的是outstandingQueue的话则把它清空
if (queue === outstandingQueue)
outstandingQueue.head = null;
// 全部节点执行完
immediateInfo[kHasOutstanding] = 0;
}
processImmediate的逻辑就是逐个执行immediate任务队列的节点。Immediate分两个队列,正常情况下,插入的immediate节点插入到immediateQueue队列。如果执行的时候有异常,则未处理完的节点就会被插入到outstandingQueue队列,等下一次执行。另外我们看到runNextTicks。runNextTicks在每执行完immediate节点后,都先处理tick任务然后再处理下一个immediate节点。
11.1.5 Node.js的setTimeout(fn,0)和setImmediate谁先执行的问题
我们首先看一下下面这段代码
setTimeout(()=>{ console.log('setTimeout'); },0)
setImmediate(()=>{ console.log('setImmedate');})
我们执行上面这段代码,会发现输出是不确定的。下面来看一下为什么。Node.js的事件循环分为几个阶段(phase)。setTimeout是属于定时器阶段,setImmediate是属于check阶段。顺序上定时器阶段是比check更早被执行的。其中setTimeout的实现代码里有一个很重要的细节。
after *= 1; // coalesce to number or NaN
if (!(after >= 1 && after <= TIMEOUT_MAX)) {
if (after > TIMEOUT_MAX) {
process.emitWarning(`错误提示`);
}
after = 1; // schedule on next tick, follows browser behavior
}
我们发现虽然我们传的超时时间是0,但是0不是合法值,Node.js会把超时时间变成1。这就是导致上面的代码输出不确定的原因。我们分析一下这段代码的执行过程。Node.js启动的时候,会编译执行上面的代码,开始一个定时器,挂载一个setImmediate节点在队列。然后进入Libuv的事件循环,然后执行定时器阶段,Libuv判断从开启定时器到现在是否已经过去了1毫秒,是的话,执行定时器回调,否则执行下一个节点,执行完其它阶段后,会执行check阶段。这时候就会执行setImmediate的回调。所以,一开始的那段代码的输出结果是取决于启动定时器的时间到Libuv执行定时器阶段是否过去了1毫秒。
11.2 nextTick
nextTick用于异步执行一个回调函数,和setTimeout、setImmediate类似,不同的地方在于他们的执行时机,setTimeout和setImmediate的任务属于事件循环的一部分,但是nextTick的任务不属于事件循环的一部分,具体的执行时机我们会在本节分析。
11.2.1 初始化nextTick
nextTick函数是在Node.js启动过程中,在执行bootstrap/node.js时挂载到process对象中。
const { nextTick, runNextTicks } = setupTaskQueue();
process.nextTick = nextTick;
// 真正的定义在task_queues.js。
setupTaskQueue() {
setTickCallback(processTicksAndRejections);
return {
nextTick,
};
},
nextTick接下来会讲,setTickCallback是注册处理tick任务的函数,
static void SetTickCallback(const FunctionCallbackInfo<Value>& args) {
Environment* env = Environment::GetCurrent(args);
CHECK(args[0]->IsFunction());
env->set_tick_callback_function(args[0].As<Function>());
}
只是简单地保存处理tick任务的函数。后续会用到
11.2.2 nextTick生产任务
function nextTick(callback) {
let args;
switch (arguments.length) {
case 1: break;
case 2: args = [arguments[1]]; break;
case 3: args = [arguments[1], arguments[2]]; break;
case 4: args = [arguments[1], arguments[2], arguments[3]]; break;
default:
args = new Array(arguments.length - 1);
for (let i = 1; i < arguments.length; i++)
args[i - 1] = arguments[i];
}
// 第一个任务,开启tick处理逻辑
if (queue.isEmpty())
setHasTickScheduled(true);
const asyncId = newAsyncId();
const triggerAsyncId = getDefaultTriggerAsyncId();
const tickObject = {
[async_id_symbol]: asyncId,
[trigger_async_id_symbol]: triggerAsyncId,
callback,
args
};
// 插入队列
queue.push(tickObject);
}
这就是我们执行nextTick时的逻辑。每次调用nextTick都会往队列中追加一个节点。
11.2.3 处理tick任务
我们再看一下处理的tick任务的逻辑。Nodejs在初始化时,通过执行setTickCallback(processTicksAndRejections)注册了处理tick任务的函数。Node.js在初始化时把处理tick任务的函数保存到env中。另外,Nodejs使用TickInfo类管理tick的逻辑。
class TickInfo : public MemoryRetainer {
public:
inline AliasedUint8Array& fields();
inline bool has_tick_scheduled() const;
inline bool has_rejection_to_warn() const;
private:
inline explicit TickInfo(v8::Isolate* isolate);
enum Fields { kHasTickScheduled = 0, kHasRejectionToWarn, kFieldsCount };
AliasedUint8Array fields_;
};
TickInfo主要是有两个标记位,kHasTickScheduled标记是否有tick任务需要处理。然后通过InternalCallbackScope类的对象方法Close函数执行tick_callback_function。当Nodejs底层需要执行一个js回调时,会调用AsyncWrap的MakeCallback。MakeCallback里面调用了InternalMakeCallback。
MaybeLocal<Value> InternalMakeCallback(Environment* env, Local<Object> recv,
const Local<Function> callback, int argc, Local<Value> argv[],
async_context asyncContext) {
InternalCallbackScope scope(env, recv, asyncContext);
// 执行用户层js回调
scope.Close();
return ret;
}
我们看InternalCallbackScope 的Close
void InternalCallbackScope::Close() {
// 省略部分代码
TickInfo* tick_info = env_->tick_info();
// 没有tick任务则不需要往下走,在插入tick任务的时候会设置这个为true,没有任务时变成false
if (!tick_info->has_tick_scheduled() && !tick_info->has_rejection_to_warn()) {
return;
}
HandleScope handle_scope(env_->isolate());
Local<Object> process = env_->process_object();
if (!env_->can_call_into_js()) return;
// 处理tick的函数
Local<Function> tick_callback = env_->tick_callback_function();
// 处理tick任务
if (tick_callback->Call(env_->context(), process, 0, nullptr).IsEmpty()) {
failed_ = true;
}
}
我们看到每次执行js层的回调的时候,就会处理tick任务。Close函数可以主动调用,或者在InternalCallbackScope对象析构的时候被调用。除了执行js回调时是主动调用Close外,一般处理tick任务的时间点就是在InternalCallbackScope对象被析构的时候。所以在定义了InternalCallbackScope对象的时候,一般就会在对象析构的时候,进行tick任务的处理。另外一种就是在执行的js回调里,调用runNextTicks处理tick任务。比如执行immediate任务的过程中。
function runNextTicks() {
if (!hasTickScheduled() && !hasRejectionToWarn())
runMicrotasks();
if (!hasTickScheduled() && !hasRejectionToWarn())
return;
processTicksAndRejections();
}
我们看processTicksAndRejections是如何处理tick任务的。
function processTicksAndRejections() {
let tock;
do {
while (tock = queue.shift()) {
const asyncId = tock[async_id_symbol];
emitBefore(asyncId, tock[trigger_async_id_symbol]);
try {
const callback = tock.callback;
if (tock.args === undefined) {
callback();
} else {
const args = tock.args;
switch (args.length) {
case 1: callback(args[0]); break;
case 2: callback(args[0], args[1]); break;
case 3: callback(args[0], args[1], args[2]); break;
case 4: callback(args[0], args[1], args[2], args[3]); break;
default: callback(...args);
}
}
} finally {
if (destroyHooksExist())
emitDestroy(asyncId);
}
emitAfter(asyncId);
}
runMicrotasks();
} while (!queue.isEmpty() || processPromiseRejections());
setHasTickScheduled(false);
setHasRejectionToWarn(false);
}
从processTicksAndRejections代码中,我们可以看到,Node.js是实时从任务队列里取节点执行的,所以如果我们在nextTick的回调里一直调用nextTick的话,就会导致死循环。
function test() {
process.nextTick(() => {
console.log(1);
test()
});
}
test();
setTimeout(() => {
console.log(2)
}, 10)
上面的代码中,会一直输出1,不会输出2。而在Nodejs源码的很多地方都处理了这个问题,首先把要执行的任务队列移到一个变量q2中,清空之前的队列q1。接着遍历q2指向的队列,如果执行回调的时候又新增了节点,只会加入到q1中。q2不会导致死循环。
11.2.4 nextTick的使用
我们知道nextTick可用于延迟执行一些逻辑,我们看一下哪些场景下可以使用nextTick。
const { EventEmitter } = require('events');
class DemoEvents extends EventEmitter {
constructor() {
super();
this.emit('start');
}
}
const demoEvents = new DemoEvents();
demoEvents.on('start', () => {
console.log('start');
});
以上代码在构造函数中会触发start事件,但是事件的注册却在构造函数之后执行,而在构造函数之前我们还没有拿到DemoEvents对象,无法完成事件的注册。这时候,我们就可以使用nextTick。
const { EventEmitter } = require('events');
class DemoEvents extends EventEmitter {
constructor() {
super();
process.nextTick(() => {
this.emit('start');
})
}
}
const demoEvents = new DemoEvents();
demoEvents.on('start', () => {
console.log('start');
});