前言:Node.js提供的Inspector不仅可以用来调试Node.js代码,还可以实时收集Node.js进程的内存,CPU等数据,同时支持静态、动态开启,是一个非常强大的工具,本文从使用和原理详细讲解Inspector

Node.js的文档中对inspector的描述很少,但是如果深入探索,其实里面的内容还是挺多的。我们先看一下Inspector的使用。

1 Inspector的使用

1.1 本地调试

我们先从一个例子开始。下面是一个http服务器。

  1. const http = require('http');
  2. http.createServer((req, res) => {
  3. res.end('ok');
  4. }).listen(80);

然后我们以node —inspect httpServer.js的方式启动。我们可以看到以下输出。

  1. Debugger listening on ws://127.0.0.1:9229/fbbd9d8f-e088-48cc-b1e0-e16bfe58db44
  2. For help, see: https://nodejs.org/en/docs/inspector

9229端口是Node.js默认选择的端口,当然我们也可以自定义,具体可参考文档。这时候我们去浏览器打开开发者工具,菜单栏多了一个调试Node.js的按钮。
24-Inspector - 图1
点击这个按钮。我们可以看到以下界面。
24-Inspector - 图2
我们可以选择某一行代码打断点,比如我在第三行,这时候我们访问80端口,开发者工具就会停留在断点处。这时候我们可以看到一些执行上下文。
24-Inspector - 图3

1.2 远程调试

但很多时候我们可能需要远程调试。比如我在一台云服务器上部署以上服务器代码。然后执行

  1. node --inspect=0.0.0.0:8888 httpServer.js

不过这时候我们打开开发者工具就会发现按钮置灰或者找不到我们远程服务器的信息。这时候我们需要用另一种方式。通过在浏览器url输入框输入devtools://devtools/bundled/js_app.html?experiments=true&v8only=true&ws={host}:{port}/{path}的方式(替换{}里面的内容为你执行Node.js时输出的信息),浏览器就会去连接你输入的地址,比如1.1.1.1:9229/abc。这种比较适合于对于通用的场景。

1.3 自动探测

如果是我们自己调试的话,这种方式看起来就有点麻烦,我们可以使用浏览器提供的自动探测功能。
1 url输入框输入chrome://inspect/#devices我们会看到以下界面
24-Inspector - 图4
2 点击configure按钮,在弹出的弹框里输入你远程服务器的地址
24-Inspector - 图5
3 配置完毕后,我们会看到界面变成这样了,或者打开新的tab,我们看到开发者工具的调试按钮也变亮了。
24-Inspector - 图6
4 这时候我们点击inspect按钮、Open dedicated DevTools for Node按钮或者打开新tab的开发者工具,就可以开始调试。而且还可以调试Node.js的原生js模块。
24-Inspector - 图7
24-Inspector - 图8

2 Inspector调试的原理

下面以通过url的方式调试(可以看到network),来看看调试的时候都发生了什么,浏览器和远程服务器建立连接后,是通过websocket协议通信的。
24-Inspector - 图9
我们看一下这命令是什么意思,首先看Debugger.scriptParsed。

Debugger.scriptParsed #
Fired when virtual machine parses script. This event is also fired for all known and uncollected scripts upon enabling debugger.

从说明中我们看到,当V8解析脚本的时候就会触发这个事件,那就会告诉浏览器这个信息。
24-Inspector - 图10
我们发现返回的都是一些元数据,没有脚本的具体代码内容,这时候浏览器会再次发起请求,
24-Inspector - 图11
我们看到这个脚本的scriptId是103。所以请求里带了这个scriptId。对应的请求id是11。接着看一下响应。
24-Inspector - 图12
至此,我们了解了获取脚本内容的过程,然后我们看看调试的时候是怎样的过程。当我们在浏览器上点击某一行设置断点的时候,浏览器就会发送一个请求。
24-Inspector - 图13
这个命令的意义顾名思义,我们看一下具体定义。

Debugger.setBreakpointByUrl #
Sets JavaScript breakpoint at given location specified either by URL or URL regex. Once this command is issued, all existing parsed scripts will have breakpoints resolved and returned in locations property. Further matching script parsing will result in subsequent breakpointResolved events issued. This logical breakpoint will survive page reloads.

接着服务返回响应。
24-Inspector - 图14
这时候我们从另外一个tab访问80端口。服务器就会在我们设置的断点处停留,并且通知浏览器。
24-Inspector - 图15
我们看一下这个命令的意思。
24-Inspector - 图16
这个命令就是当服务器执行到断点时通知浏览器,并且返回执行的一些上下文,比如是哪个执行到哪个断点停留了。这时候浏览器侧也会停留在对应的地方,当我们hover某个变量时,就会看到对应的上下文。这些都是通过具体的命令获取的数据。就不一一分析了,可以参考具体文档。
24-Inspector - 图17

3 Inspector的实现

大致了解了浏览器和服务器的交互过程和协议后,我们再来深入了解一下关于inspector的一些实现。当然这里不是分析V8中Inspector的实现,而是分析如何使用V8的Inspector以及Node.js中关于Inspector的实现部分。

3.1 开源实现

因为Node.js的实现比较复杂,这里先以一个简单版的调试工具源码来分析inspector的原理。我们先看一下初始化代码。

  1. inspector = std::unique_ptr<Inspector>(new Inspector(v8Platform, context, port));
  2. inspector->startAgent();

首先新建一个Inspector。然后启动它。接下来看看Inspector里的逻辑。

  1. Inspector::Inspector(
  2. const std::unique_ptr<v8::Platform> &platform,
  3. const v8::Local<v8::Context> &context,
  4. const int webSocketPort) {
  5. context_ = context;
  6. // 新建一个websocket server用于和客户端通信
  7. websocket_server_ = std::unique_ptr<WebSocketServer>(
  8. new WebSocketServer(
  9. webSocketPort,
  10. // 收到客户的的消息后执行onMessage回调
  11. std::bind(&Inspector::onMessage, this, std::placeholders::_1)
  12. )
  13. );
  14. // 新建一个inspector client和V8通信
  15. inspector_client_ = std::unique_ptr<V8InspectorClientImpl>(
  16. new V8InspectorClientImpl(
  17. platform,
  18. context_,
  19. // 收到V8的消息后调用sendMessage回复给客户的
  20. std::bind(&Inspector::sendMessage, this, std::placeholders::_1),
  21. std::bind(&Inspector::waitForFrontendMessage, this)
  22. )
  23. );
  24. }

代码看起来很复杂,不过我们不需要深究。主要是两个部分,一个是新建一个websocket服务器,一个是新建一个inspector客户端(用于和V8 Inspector通信),整体架构如下。
24-Inspector - 图18
接下来分别看一下websocket服务器和inspector客户端的实现。首先看一下websocket服务器的构造函数。

  1. WebSocketServer::WebSocketServer(int port, std::function<void(std::string)> onMessage)
  2. {
  3. port_ = port;
  4. onMessage_ = std::move(onMessage);
  5. }

WebSocketServer构造函数的实现很简单,只是初始化一些字段。接着看inspector客户端的实现。

  1. V8InspectorClientImpl:: V8InspectorClientImpl(const std::unique_ptr<v8::Platform> &platform, const v8::Local<v8::Context> &context, const std::function<void(std::string)> &onResponse, const std::function<int(void)> &onWaitFrontendMessageOnPause) {
  2. platform_ = platform.get();
  3. context_ = context;
  4. onWaitFrontendMessageOnPause_ = onWaitFrontendMessageOnPause;
  5. isolate_ = context_->GetIsolate();
  6. // 创建一个channel和inspector通信,收到V8消息时会执行onResponse
  7. channel_.reset(new V8InspectorChannelImp(isolate_, onResponse));
  8. // 新建一个V8提供的inspector
  9. inspector_ = v8_inspector::V8Inspector::create(isolate_, this);
  10. // 创建一个和inspector通信的session。
  11. session_ = inspector_->connect(kContextGroupId, channel_.get(), v8_inspector::StringView());
  12. context_->SetAlignedPointerInEmbedderData(1, this);
  13. v8_inspector::StringView contextName = convertToStringView("inspector");
  14. inspector_->contextCreated(v8_inspector::V8ContextInfo(context, kContextGroupId, contextName));
  15. terminated_ = true;
  16. run_nested_loop_ = false;
  17. }

上面代码很多,主要是根据V8提供的API来就行。这里主要有三个概念
1 V8Inspector是V8提供的类。
2 session表示和V8 inspector通信的会话。
3 channel用于和V8 inspector通信,从API来看,channel只能从V8获取数据,写入数据是另外的API。
这时候的架构如下
24-Inspector - 图19
至此,websocket服务器和inspector客户端就分析完毕了,回到最开始的代码,初始化完毕后会执行startAgent。

  1. void Inspector::startAgent() {
  2. websocket_server_->run();
  3. }
  4. // 启动websocket服务器
  5. void WebSocketServer::run() {
  6. auto const address = net::ip::make_address("127.0.0.1");
  7. net::io_context ioc{1};
  8. tcp::acceptor acceptor{ioc, {address, static_cast<unsigned short>(port_)}};
  9. tcp::socket socket{ioc};
  10. acceptor.accept(socket);
  11. ws_ = std::unique_ptr<websocket::stream<tcp::socket>>(new websocket::stream<tcp::socket>(std::move(socket)));
  12. startListening();
  13. }
  14. // 等待连接
  15. void WebSocketServer::startListening()
  16. {
  17. ws_->accept();
  18. while (true) {
  19. waitFrontendMessage();
  20. }
  21. }
  22. // 读取连接中的消息
  23. void WebSocketServer::waitFrontendMessage()
  24. {
  25. beast::flat_buffer buffer;
  26. ws_->read(buffer);
  27. std::string message = boost::beast::buffers_to_string(buffer.data());
  28. onMessage_(std::move(message));
  29. }

startAgent的逻辑就是启动websocket服务器。启动完毕后就等待客户的连接。连接成功后执行onMessage_。我们看一下onMessage的实现。

  1. void Inspector::onMessage(const std::string& message) {
  2. std::cout << "CDT message: " << message << std::endl;
  3. // StringView是V8要求的格式
  4. v8_inspector::StringView protocolMessage = convertToStringView(message);
  5. // 通知V8 Inspector
  6. inspector_client_->dispatchProtocolMessage(protocolMessage);
  7. }

onMessage通过Inspector客户端把消息交给V8 Inspector处理。V8 Inspector处理完后,通过channel通知Inspector客户端,对应的函数是sendResponse。V8InspectorChannelImp是继承V8提供的Channel,sendResponse是一个纯虚函数,由V8InspectorChannelImp实现。

  1. void V8InspectorChannelImp::sendResponse(int callId, std::unique_ptr<v8_inspector::StringBuffer> message) {
  2. const std::string response = convertToString(isolate_, message->string());
  3. onResponse_(response);
  4. }

onResponse_是在Chnnel初始化时设置的,对应函数是inspector客户端的sendMessage。

  1. void Inspector::sendMessage(const std::string& message) {
  2. websocket_server_->sendMessage(message);
  3. }

sendMessage通过websocket服务器把V8 Inspector返回的消息返回给客户的。至此,整个通信流程就完成了。

3.2 Node.js的实现(v14)

Node.js的实现非常复杂并且很绕,也无法通俗易懂地介绍和分析,只能按照我自己的思路大致讲解一下流程,有兴趣的同学可以自行阅读源码。当我们以以下方式执行我们的应用时

  1. node --inspect app.js

3.2.1 初始化

Node.js在启动的过程中,就会初始化Inspector相关的逻辑。

  1. inspector_agent_ = std::make_unique<inspector::Agent>(this);

Agent是负责和V8 Inspector通信的对象。创建完后接着执行env->InitializeInspector({})启动Agent。

  1. inspector_agent_->Start(...);

Start继续执行Agent::StartIoThread。

  1. bool Agent::StartIoThread() {
  2. io_ = InspectorIo::Start(client_->getThreadHandle(), ...);
  3. return true;
  4. }

StartIoThread中的client_->getThreadHandle()是重要的逻辑,我们先来分析该函数。

  1. std::shared_ptr<MainThreadHandle> getThreadHandle() {
  2. if (!interface_) {
  3. interface_ = std::make_shared<MainThreadInterface>(env_->inspector_agent(), ...);
  4. }
  5. return interface_->GetHandle();
  6. }

getThreadHandle首先创建来一个MainThreadInterface对象,接着又调用了他的GetHandle方法,我们看一下该方法的逻辑。

  1. std::shared_ptr<MainThreadHandle> MainThreadInterface::GetHandle() {
  2. if (handle_ == nullptr)
  3. handle_ = std::make_shared<MainThreadHandle>(this);
  4. return handle_;
  5. }

GetHandlei了创建了一个MainThreadHandle对象,最终结构如下所示。
24-Inspector - 图20
分析完后我们继续看Agent::StartIoThread中InspectorIo::Start的逻辑。

  1. std::unique_ptr<InspectorIo> InspectorIo::Start(std::shared_ptr<MainThreadHandle> main_thread, ...) {
  2. auto io = std::unique_ptr<InspectorIo>(new InspectorIo(main_thread, ...));
  3. return io;
  4. }

InspectorIo::Star里新建了一个InspectorIo对象,我们看看InspectorIo构造函数的逻辑。

  1. InspectorIo::InspectorIo(std::shared_ptr<MainThreadHandle> main_thread, ...)
  2. :
  3. // 初始化main_thread_
  4. main_thread_(main_thread)) {
  5. // 新建一个子线程,子线程中执行InspectorIo::ThreadMain
  6. uv_thread_create(&thread_, InspectorIo::ThreadMain, this);
  7. }

这时候结构如下。
24-Inspector - 图21
Inspector在子线程里启动的原因主要有两个。
1 如果在主线程里运行,那么当我们断点调试的时候,Node.js主线程就会被停住,也就无法处理客户端发过来的调试指令。
2 如果主线程陷入死循环,我们就无法实时抓取进程的profile数据来分析原因。
接着继续看一下子线程里执行InspectorIo::ThreadMain的逻辑。

  1. void InspectorIo::ThreadMain(void* io) {
  2. static_cast<InspectorIo*>(io)->ThreadMain();
  3. }
  4. void InspectorIo::ThreadMain() {
  5. uv_loop_t loop;
  6. loop.data = nullptr;
  7. // 在子线程开启一个新的事件循环
  8. int err = uv_loop_init(&loop);
  9. std::shared_ptr<RequestQueueData> queue(new RequestQueueData(&loop), ...);
  10. // 新建一个delegate,用于处理请求
  11. std::unique_ptr<InspectorIoDelegate> delegate(
  12. new InspectorIoDelegate(queue, main_thread_, ...)
  13. );
  14. InspectorSocketServer server(std::move(delegate), ...);
  15. server.Start()
  16. uv_run(&loop, UV_RUN_DEFAULT);
  17. }

ThreadMain里主要三个逻辑
1 创建一个delegate对象,该对象是核心的对象,后面我们会看到有什么作用。
2 创建一个服务器并启动。
3 开启事件循环。
接下来看一下服务器的逻辑,首先看一下创建服务器的逻辑。

  1. InspectorSocketServer::InspectorSocketServer(std::unique_ptr<SocketServerDelegate> delegate, ...)
  2. :
  3. // 保存delegate
  4. delegate_(std::move(delegate)),
  5. // 初始化sessionId
  6. next_session_id_(0) {
  7. // 设置delegate的server为当前服务器
  8. delegate_->AssignServer(this);
  9. }

执行完后形成以下结构。
24-Inspector - 图22
接着我们看启动服务器的逻辑。

  1. bool InspectorSocketServer::Start() {
  2. // DNS解析,比如输入的是localhost
  3. struct addrinfo hints;
  4. memset(&hints, 0, sizeof(hints));
  5. hints.ai_flags = AI_NUMERICSERV;
  6. hints.ai_socktype = SOCK_STREAM;
  7. uv_getaddrinfo_t req;
  8. const std::string port_string = std::to_string(port_);
  9. uv_getaddrinfo(loop_, &req, nullptr, host_.c_str(),
  10. port_string.c_str(), &hints);
  11. // 监听解析到的ip列表
  12. for (addrinfo* address = req.addrinfo;
  13. address != nullptr;
  14. address = address->ai_next) {
  15. auto server_socket = ServerSocketPtr(new ServerSocket(this));
  16. err = server_socket->Listen(address->ai_addr, loop_);
  17. if (err == 0)
  18. server_sockets_.push_back(std::move(server_socket));
  19. }
  20. return true;
  21. }

首先根据参数做一个DNS解析,然后根据拿到的ip列表(通常是一个),创建对应个数的ServerSocket对象,并执行他的Listen方法。ServerSocket表示一个监听socket。看一下ServerSocket的构造函数。

  1. ServerSocket(InspectorSocketServer* server)
  2. : tcp_socket_(uv_tcp_t()), server_(server) {}

执行完后结构如下。
24-Inspector - 图23
接着看一下ServerSocket的Listen方法。

  1. int ServerSocket::Listen(sockaddr* addr, uv_loop_t* loop) {
  2. uv_tcp_t* server = &tcp_socket_;
  3. uv_tcp_init(loop, server)
  4. uv_tcp_bind(server, addr, 0);
  5. uv_listen(reinterpret_cast<uv_stream_t*>(server),
  6. 511,
  7. ServerSocket::SocketConnectedCallback);
  8. }

Listen调用Libuv的接口完成服务器的启动。至此,Inspector提供的Weboscket服务器启动了。

3.2.2 处理连接

从刚才分析中可以看到,当有连接到来时执行回调ServerSocket::SocketConnectedCallback。

  1. void ServerSocket::SocketConnectedCallback(uv_stream_t* tcp_socket,
  2. int status) {
  3. if (status == 0) {
  4. // 根据Libuv handle找到对应的ServerSocket对象
  5. ServerSocket* server_socket = ServerSocket::FromTcpSocket(tcp_socket);
  6. // Socket对象的server_字段保存了所在的InspectorSocketServer
  7. server_socket->server_->Accept(server_socket->port_, tcp_socket);
  8. }
  9. }

接着看InspectorSocketServer的Accept是如何处理连接的。

  1. void InspectorSocketServer::Accept(int server_port,
  2. uv_stream_t* server_socket) {
  3. std::unique_ptr<SocketSession> session(
  4. new SocketSession(this, next_session_id_++, server_port)
  5. );
  6. InspectorSocket::DelegatePointer delegate =
  7. InspectorSocket::DelegatePointer(
  8. new SocketSession::Delegate(this, session->id())
  9. );
  10. InspectorSocket::Pointer inspector =
  11. InspectorSocket::Accept(server_socket, std::move(delegate));
  12. if (inspector) {
  13. session->Own(std::move(inspector));
  14. connected_sessions_[session->id()].second = std::move(session);
  15. }
  16. }

Accept的首先创建里一个SocketSession和SocketSession::Delegate对象。然后调用InspectorSocket::Accept,从代码中可以看到InspectorSocket::Accept会返回一个InspectorSocket对象。InspectorSocket是对通信socket的封装(和客户端通信的socket,区别于服务器的监听socket)。然后记录session对象对应的InspectorSocket对象,同时记录sessionId和session的映射关系。结构如下图所示。
24-Inspector - 图24
接着看一下InspectorSocket::Accept返回InspectorSocket的逻辑。

  1. InspectorSocket::Pointer InspectorSocket::Accept(uv_stream_t* server,
  2. DelegatePointer delegate) {
  3. auto tcp = TcpHolder::Accept(server, std::move(delegate));
  4. InspectorSocket* inspector = new InspectorSocket();
  5. inspector->SwitchProtocol(new HttpHandler(inspector, std::move(tcp)));
  6. return InspectorSocket::Pointer(inspector);
  7. }

InspectorSocket::Accept的代码不多,但是逻辑还是挺多的。
1 InspectorSocket::Accept再次调用TcpHolder::Accept获得一个TcpHolder对象。

  1. TcpHolder::Pointer TcpHolder::Accept(
  2. uv_stream_t* server,
  3. InspectorSocket::DelegatePointer delegate) {
  4. // 新建一个TcpHolder对象,TcpHolder是对uv_tcp_t和delegate的封装
  5. TcpHolder* result = new TcpHolder(std::move(delegate));
  6. // 拿到TcpHolder对象的uv_tcp_t结构体
  7. uv_stream_t* tcp = reinterpret_cast<uv_stream_t*>(&result->tcp_);
  8. // 初始化
  9. int err = uv_tcp_init(server->loop, &result->tcp_);
  10. // 摘取一个TCP连接对应的fd保存到TcpHolder的uv_tcp_t结构体中(即第二个参数的tcp字段)
  11. uv_accept(server, tcp);
  12. // 注册等待可读事件,有数据时执行OnDataReceivedCb回调
  13. uv_read_start(tcp, allocate_buffer, OnDataReceivedCb);
  14. return TcpHolder::Pointer(result);
  15. }

2 新建一个HttpHandler对象。

  1. explicit HttpHandler(InspectorSocket* inspector, TcpHolder::Pointer tcp)
  2. : ProtocolHandler(inspector, std::move(tcp)){
  3. llhttp_init(&parser_, HTTP_REQUEST, &parser_settings);
  4. llhttp_settings_init(&parser_settings);
  5. parser_settings.on_header_field = OnHeaderField;
  6. parser_settings.on_header_value = OnHeaderValue;
  7. parser_settings.on_message_complete = OnMessageComplete;
  8. parser_settings.on_url = OnPath;
  9. }
  10. ProtocolHandler::ProtocolHandler(InspectorSocket* inspector,
  11. TcpHolder::Pointer tcp)
  12. : inspector_(inspector), tcp_(std::move(tcp)) {
  13. // 设置TCP数据的handler,TCP是只负责传输,数据的解析交给handler处理
  14. tcp_->SetHandler(this);
  15. }

HttpHandler是对uv_tcp_t的封装,主要通过HTTP解析器llhttp对HTTP协议进行解析。
3 调用inspector->SwitchProtocol()切换当前协议为HTTP,建立TCP连接后,首先要经过一个HTTP请求从HTTP协议升级到WebSocket协议,升级成功后就使用Websocket协议进行通信。
我们看一下这时候的结构图。
24-Inspector - 图25
至此,就完成了连接处理的分析。

3.2.3 协议升级

完成了TCP连接的处理后,接下来要完成协议升级,因为Inspector是通过WebSocket协议和客户端通信的,所以需要通过一个HTTP请求来完成HTTP到WebSocekt协议的升级。从刚才的分析中看当有数据到来时会执行OnDataReceivedCb回调。

  1. void TcpHolder::OnDataReceivedCb(uv_stream_t* tcp, ssize_t nread,
  2. const uv_buf_t* buf) {
  3. TcpHolder* holder = From(tcp);
  4. holder->ReclaimUvBuf(buf, nread);
  5. // 调用handler的onData,目前handler是HTTP协议
  6. holder->handler_->OnData(&holder->buffer);
  7. }

TCP层收到数据后交给应用层解析,直接调用上层的OnData回调。

  1. void OnData(std::vector<char>* data) override {
  2. // 解析HTTP协议
  3. llhttp_execute(&parser_, data->data(), data->size());
  4. // 解析完并且是升级协议的请求则调用delegate的回调OnSocketUpgrade
  5. delegate()->OnSocketUpgrade(event.host, event.path, event.ws_key);
  6. }

OnData可能会被多次回调,并通过llhttp_execute解析收到的HTTP报文,当发现是一个协议升级的请求后,就调用OnSocketUpgrade回调。delegate是TCP层保存的SocketSession::Delegate对象。来看一下该对象的OnSocketUpgrade方法。

  1. void SocketSession::Delegate::OnSocketUpgrade(const std::string& host,
  2. const std::string& path,
  3. const std::string& ws_key) {
  4. std::string id = path.empty() ? path : path.substr(1);
  5. server_->SessionStarted(session_id_, id, ws_key);
  6. }

OnSocketUpgrade又调用来server_(InspectorSocketServer对象)的SessionStarted。

  1. void InspectorSocketServer::SessionStarted(int session_id,
  2. const std::string& id,
  3. const std::string& ws_key) {
  4. // 找到对应的session对象
  5. SocketSession* session = Session(session_id);
  6. connected_sessions_[session_id].first = id;
  7. session->Accept(ws_key);
  8. delegate_->StartSession(session_id, id);
  9. }

首先通过session_id找到建立TCP连接时分配的SocketSession对象。
1 执行session->Accept(ws_key);回复客户端同意协议升级。

  1. void Accept(const std::string& ws_key) {
  2. ws_socket_->AcceptUpgrade(ws_key);
  3. }

从结构图我们可以看到wssocket是一个InspectorSocket对象。

  1. void AcceptUpgrade(const std::string& accept_key) override {
  2. char accept_string[ACCEPT_KEY_LENGTH];
  3. generate_accept_string(accept_key, &accept_string);
  4. const char accept_ws_prefix[] = "HTTP/1.1 101 Switching Protocols\r\n"
  5. "Upgrade: websocket\r\n"
  6. "Connection: Upgrade\r\n"
  7. "Sec-WebSocket-Accept: ";
  8. const char accept_ws_suffix[] = "\r\n\r\n";
  9. std::vector<char> reply(accept_ws_prefix,
  10. accept_ws_prefix + sizeof(accept_ws_prefix) - 1);
  11. reply.insert(reply.end(), accept_string,
  12. accept_string + sizeof(accept_string));
  13. reply.insert(reply.end(), accept_ws_suffix,
  14. accept_ws_suffix + sizeof(accept_ws_suffix) - 1);
  15. // 回复101给客户端
  16. WriteRaw(reply, WriteRequest::Cleanup);
  17. // 切换handler为WebSocket handler
  18. inspector_->SwitchProtocol(new WsHandler(inspector_, std::move(tcp_)));
  19. }

AcceptUpgradeh首先回复客户端101表示同意升级道WebSocket协议,然后切换数据处理器为WsHandler,即后续的数据按照WebSocket协议处理。
2 执行delegate->StartSession(session_id, id)建立和V8 Inspector的会话。delegate是InspectorIoDelegate对象。

  1. void InspectorIoDelegate::StartSession(int session_id,
  2. const std::string& target_id) {
  3. auto session = main_thread_->Connect(
  4. std::unique_ptr<InspectorSessionDelegate>(
  5. new IoSessionDelegate(request_queue_->handle(), session_id)
  6. ),
  7. true);
  8. if (session) {
  9. sessions_[session_id] = std::move(session);
  10. fprintf(stderr, "Debugger attached.\n");
  11. }
  12. }

首先通过mainthread->Connect拿到一个session,并在InspectorIoDelegate中记录映射关系。结构图如下。
24-Inspector - 图26
接下来看一下mainthread->Connect的逻辑(mainthread是MainThreadHandle对象)。

  1. std::unique_ptr<InspectorSession> MainThreadHandle::Connect(
  2. std::unique_ptr<InspectorSessionDelegate> delegate,
  3. bool prevent_shutdown) {
  4. return std::unique_ptr<InspectorSession>(
  5. new CrossThreadInspectorSession(++next_session_id_,
  6. shared_from_this(),
  7. std::move(delegate),
  8. prevent_shutdown));
  9. }

Connect函数新建了一个CrossThreadInspectorSession对象。

  1. CrossThreadInspectorSession(
  2. int id,
  3. std::shared_ptr<MainThreadHandle> thread,
  4. std::unique_ptr<InspectorSessionDelegate> delegate,
  5. bool prevent_shutdown)
  6. // 创建一个MainThreadSessionState对象
  7. : state_(thread, std::bind(MainThreadSessionState::Create,
  8. std::placeholders::_1,
  9. prevent_shutdown)) {
  10. // 执行MainThreadSessionState::Connect
  11. state_.Call(&MainThreadSessionState::Connect, std::move(delegate));
  12. }

继续看MainThreadSessionState::Connect。

  1. void Connect(std::unique_ptr<InspectorSessionDelegate> delegate) {
  2. Agent* agent = thread_->inspector_agent();
  3. session_ = agent->Connect(std::move(delegate), prevent_shutdown_);
  4. }

继续调agent->Connect。

  1. std::unique_ptr<InspectorSession> Agent::Connect(
  2. std::unique_ptr<InspectorSessionDelegate> delegate,
  3. bool prevent_shutdown) {
  4. int session_id = client_->connectFrontend(std::move(delegate),
  5. prevent_shutdown);
  6. return std::unique_ptr<InspectorSession>(
  7. new SameThreadInspectorSession(session_id, client_));
  8. }

继续调connectFrontend

  1. int connectFrontend(std::unique_ptr<InspectorSessionDelegate> delegate,
  2. bool prevent_shutdown) {
  3. int session_id = next_session_id_++;
  4. channels_[session_id] = std::make_unique<ChannelImpl>(env_,
  5. client_,
  6. getWorkerManager(),
  7. std::move(delegate),
  8. getThreadHandle(),
  9. prevent_shutdown);
  10. return session_id;
  11. }

connectFrontend创建了一个ChannelImpl并且在channels_中保存了映射关系。看看ChannelImpl的构造函数。

  1. explicit ChannelImpl(Environment* env,
  2. const std::unique_ptr<V8Inspector>& inspector,
  3. std::unique_ptr<InspectorSessionDelegate> delegate, ...)
  4. : delegate_(std::move(delegate)) {
  5. session_ = inspector->connect(CONTEXT_GROUP_ID, this, StringView());
  6. }

ChannelImpl调用inspector->connect建立了一个和V8 Inspector的会话。结构图大致如下。
24-Inspector - 图27

3.2.4 客户端到V8 Inspector的数据处理

TCP连接建立了,协议升级也完成了,接下来就可以开始处理业务数据。从前面的分析中我们已经知道数据到来时会执行TcpHoldler的handler_->OnData回调。因为已经完成了协议升级,所以这时候的handler变成了WeSocket handler。

  1. void OnData(std::vector<char>* data) override {
  2. // 1. Parse.
  3. int processed = 0;
  4. do {
  5. processed = ParseWsFrames(*data);
  6. // 2. Fix the data size & length
  7. if (processed > 0) {
  8. remove_from_beginning(data, processed);
  9. }
  10. } while (processed > 0 && !data->empty());
  11. }

OnData通过ParseWsFrames解析WebSocket协议。

  1. int ParseWsFrames(const std::vector<char>& buffer) {
  2. int bytes_consumed = 0;
  3. std::vector<char> output;
  4. bool compressed = false;
  5. // 解析WebSocket协议
  6. ws_decode_result r = decode_frame_hybi17(buffer,
  7. true /* client_frame */,
  8. &bytes_consumed, &output,
  9. &compressed);
  10. // 执行delegate的回调
  11. delegate()->OnWsFrame(output);
  12. return bytes_consumed;
  13. }

前面已经分析过delegate是TcpHoldler的delegate,即SocketSession::Delegate对象。

  1. void SocketSession::Delegate::OnWsFrame(const std::vector<char>& data) {
  2. server_->MessageReceived(session_id_,
  3. std::string(data.data(),
  4. data.size()));
  5. }

继续回调server->MessageReceived。从结构图可以看到server是InspectorSocketServer对象。

  1. void MessageReceived(int session_id, const std::string& message) {
  2. delegate_->MessageReceived(session_id, message);
  3. }

继续回调delegate->MessageReceived。InspectorSocketServer的delegate是InspectorIoDelegate对象。

  1. void InspectorIoDelegate::MessageReceived(int session_id,
  2. const std::string& message) {
  3. auto session = sessions_.find(session_id);
  4. if (session != sessions_.end())
  5. session->second->Dispatch(Utf8ToStringView(message)->string());
  6. }

首先通过session_id找到对应的session。session是一个CrossThreadInspectorSession对象。看看他的Dispatch方法。

  1. void Dispatch(const StringView& message) override {
  2. state_.Call(&MainThreadSessionState::Dispatch,
  3. StringBuffer::create(message));
  4. }

执行MainThreadSessionState::Dispatch。

  1. void Dispatch(std::unique_ptr<StringBuffer> message) {
  2. session_->Dispatch(message->string());
  3. }

session_是SameThreadInspectorSession对象。

  1. void SameThreadInspectorSession::Dispatch(
  2. const v8_inspector::StringView& message) {
  3. auto client = client_.lock();
  4. if (client)
  5. client->dispatchMessageFromFrontend(session_id_, message);
  6. }

继续调client->dispatchMessageFromFrontend。

  1. void dispatchMessageFromFrontend(int session_id, const StringView& message) {
  2. channels_[session_id]->dispatchProtocolMessage(message);
  3. }

通过session_id找到对应的ChannelImpl,继续调ChannelImpl的dispatchProtocolMessage。

  1. voiddispatchProtocolMessage(const StringView& message) {
  2. session_->dispatchProtocolMessage(message);
  3. }

最终调用和V8 Inspector的会话对象把数据发送给V8。至此客户端到V8 Inspector的通信过程就完成了。

3.2.5 V8 Inspector到客户端的数据处理

接着看从V8 inspector到客户端的数据传递逻辑。V8 inspector是通过channel的sendResponse函数传递给客户端的。

  1. void sendResponse(
  2. int callId,
  3. std::unique_ptr<v8_inspector::StringBuffer> message) override {
  4. sendMessageToFrontend(message->string());
  5. }
  6. void sendMessageToFrontend(const StringView& message) {
  7. delegate_->SendMessageToFrontend(message);
  8. }

delegate_是IoSessionDelegate对象。

  1. void SendMessageToFrontend(const v8_inspector::StringView& message) override {
  2. request_queue_->Post(id_, TransportAction::kSendMessage,
  3. StringBuffer::create(message));
  4. }

requestqueue是RequestQueueData对象。

  1. void Post(int session_id,
  2. TransportAction action,
  3. std::unique_ptr<StringBuffer> message) {
  4. Mutex::ScopedLock scoped_lock(state_lock_);
  5. bool notify = messages_.empty();
  6. messages_.emplace_back(action, session_id, std::move(message));
  7. if (notify) {
  8. CHECK_EQ(0, uv_async_send(&async_));
  9. incoming_message_cond_.Broadcast(scoped_lock);
  10. }
  11. }

Post首先把消息入队,然后通过异步的方式通知async接着看async的处理函数(在子线程的事件循环里执行)。

  1. uv_async_init(loop, &async_, [](uv_async_t* async) {
  2. // 拿到async对应的上下文
  3. RequestQueueData* wrapper = node::ContainerOf(&RequestQueueData::async_, async);
  4. // 执行RequestQueueData的DoDispatch
  5. wrapper->DoDispatch();
  6. });
  1. void DoDispatch() {
  2. for (const auto& request : GetMessages()) {
  3. request.Dispatch(server_);
  4. }
  5. }

request是RequestToServer对象。

  1. void Dispatch(InspectorSocketServer* server) const {
  2. switch (action_) {
  3. case TransportAction::kSendMessage:
  4. server->Send(
  5. session_id_,
  6. protocol::StringUtil::StringViewToUtf8(message_->string()));
  7. break;
  8. }
  9. }

接着看InspectorSocketServer的Send。

  1. void InspectorSocketServer::Send(int session_id, const std::string& message) {
  2. SocketSession* session = Session(session_id);
  3. if (session != nullptr) {
  4. session->Send(message);
  5. }
  6. }

session代表可客户端的一个连接。

  1. void SocketSession::Send(const std::string& message) {
  2. ws_socket_->Write(message.data(), message.length());
  3. }

接着调用WebSocket handler的Write。

  1. void Write(const std::vector<char> data) override {
  2. std::vector<char> output = encode_frame_hybi17(data);
  3. WriteRaw(output, WriteRequest::Cleanup);
  4. }

WriteRaw是基类ProtocolHandler实现的。

  1. int ProtocolHandler::WriteRaw(const std::vector<char>& buffer,
  2. uv_write_cb write_cb) {
  3. return tcp_->WriteRaw(buffer, write_cb);
  4. }

最终是通过TCP连接返回给客户端。

  1. int TcpHolder::WriteRaw(const std::vector<char>& buffer, uv_write_cb write_cb) {
  2. // Freed in write_request_cleanup
  3. WriteRequest* wr = new WriteRequest(handler_, buffer);
  4. uv_stream_t* stream = reinterpret_cast<uv_stream_t*>(&tcp_);
  5. int err = uv_write(&wr->req, stream, &wr->buf, 1, write_cb);
  6. if (err < 0)
  7. delete wr;
  8. return err < 0;
  9. }

新建一个写请求,socket可写的时候发送数据给客户端。

4 动态开启Inspector

默认打开Inspector能力是不安全的,这意味着能连上websocket服务器的客户端都能通过协议控制Node.js进程,通常我们是在Node.js进程出现问题的时候,动态开启Inspector。

  1. const http = require('http');
  2. const inspector = require('inspector');
  3. const fs = require('fs');
  4. http.createServer((req, res) => {
  5. if (req.url == 'debug') {
  6. const session = new inspector.Session();
  7. session.connect();
  8. session.post('Profiler.enable', () => {
  9. session.post('Profiler.start', () => {
  10. session.post('Profiler.stop', (err, { profile }) => {
  11. if (!err) {
  12. fs.writeFileSync('./profile.cpuprofile', JSON.stringify(profile));
  13. }
  14. session.disconnect();
  15. res.end('ok');
  16. });
  17. });
  18. });
  19. } else {
  20. res.end('ok');
  21. }
  22. }).listen(80);

我们可以通过url参数控制Inspector的能力,本地调试时可以在vscode里可以直接看到数据。
24-Inspector - 图28

5 收集数据

V8 inspector是一个非常强大的工具,调试只是它其中一个能力,他还可以获取内存、CPU等数据,具体能力请参考文档。
24-Inspector - 图29

后记:Node.js的inspector是在Node.js额外线程里开启的一个非常强大的工具,通过Node.js作为中间人,完成客户端和V8 inspector的通信(调试、收集数据),是我们调试和诊断Node.js进程非常好的方式。

参考内容:
1 Debugging Guide
2 inspector
3 开源的inspector agent实现
4 inpector协议文档
5 Debugging Node.js with Chrome DevTools