原文地址

文章导览

2022/02/21 *-【深入理解Node.js 中的进程与线程】 - 图1

面试会问

  • Node.js是单线程吗?
  • Node.js 做耗时的计算时候,如何避免阻塞?
  • Node.js如何实现多进程的开启和关闭?
  • Node.js可以创建线程吗?
  • 你们开发过程中如何实现进程守护的?
  • 除了使用第三方模块,你们自己是否封装过一个多进程架构?

    进程

    进程Process是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础,进程是线程的容器(来自百科)。进程是资源分配的最小单位。我们启动一个服务、运行一个实例,就是开一个服务进程,例如 Java 里的 JVM 本身就是一个进程,Node.js 里通过 node app.js 开启一个服务进程,多进程就是进程的复制(fork),fork 出来的每个进程都拥有自己的独立空间地址、数据栈,一个进程无法访问另外一个进程里定义的变量、数据结构,只有建立了 IPC 通信,进程之间才可数据共享。

  • Node.js开启服务进程例子 ```javascript const http = require(‘http’);

const server = http.createServer(); server.listen(3000,()=>{ process.title=’程序员成长指北测试进程’; console.log(‘进程id’,process.pid) })

  1. 运行上面代码后,以下为 Mac 系统自带的监控工具 “活动监视器” 所展示的效果,可以看到我们刚开启的 Nodejs 进程 7663<br />![](https://cdn.nlark.com/yuque/0/2022/webp/21425465/1645428815238-68e8b9ec-e7eb-417f-a7e1-87bd5a074f52.webp#clientId=uccc1309e-0719-4&crop=0&crop=0&crop=1&crop=1&from=paste&id=uc383284f&margin=%5Bobject%20Object%5D&originHeight=1182&originWidth=1406&originalType=url&ratio=1&rotation=0&showTitle=false&status=done&style=none&taskId=u931b75a1-db5b-41ea-b0d1-6b80af0d5a3&title=)
  2. <a name="RLoYt"></a>
  3. ## 线程
  4. 线程是操作系统能够进行运算调度的最小单位,首先我们要清楚线程是隶属于进程的,被包含于进程之中。**一个线程只能隶属于一个进程,但是一个进程是可以拥有多个线程的**。
  5. <a name="jypWX"></a>
  6. ### 单线程
  7. **单线程就是一个进程只开一个线程**<br />Javascript 就是属于单线程,程序顺序执行(这里暂且不提JS异步),可以想象一下队列,前面一个执行完之后,后面才可以执行,当你在使用单线程语言编码时切勿有过多耗时的同步操作,否则线程会造成阻塞,导致后续响应无法处理。你如果采用 Javascript 进行编码时候,请尽可能的利用Javascript异步操作的特性。
  8. <a name="IBCn3"></a>
  9. #### 经典计算耗时造成线程阻塞的例子
  10. ```javascript
  11. const http = require('http');
  12. const longComputation = () => {
  13. let sum = 0;
  14. for (let i = 0; i < 1e10; i++) {
  15. sum += i;
  16. };
  17. return sum;
  18. };
  19. const server = http.createServer();
  20. server.on('request', (req, res) => {
  21. if (req.url === '/compute') {
  22. console.info('计算开始',new Date());
  23. const sum = longComputation();
  24. console.info('计算结束',new Date());
  25. return res.end(`Sum is ${sum}`);
  26. } else {
  27. res.end('Ok')
  28. }
  29. });
  30. server.listen(3000);
  31. //打印结果
  32. //计算开始 2019-07-28T07:08:49.849Z
  33. //计算结束 2019-07-28T07:09:04.522Z

查看打印结果,当我们调用127.0.0.1:3000/compute 的时候,如果想要调用其他的路由地址比如127.0.0.1/大约需要15秒时间,也可以说一个用户请求完第一个compute接口后需要等待15秒,这对于用户来说是极其不友好的。下文我会通过创建多进程的方式child_process.fork 和cluster 来解决解决这个问题。

单线程的一些说明

  • Node.js 虽然是单线程模型,但是其基于事件驱动、异步非阻塞模式,可以应用于高并发场景,避免了线程创建、线程之间上下文切换所产生的资源开销。
  • 当你的项目中需要有大量计算,CPU 耗时的操作时候,要注意考虑开启多进程来完成了。
  • Node.js 开发过程中,错误会引起整个应用退出,应用的健壮性值得考验,尤其是错误的异常抛出,以及进程守护是必须要做的。
  • 单线程无法利用多核CPU,但是后来Node.js 提供的API以及一些第三方工具相应都得到了解决,文章后面都会讲到。

    Node.js 中的进程与线程

    Node.js 是 Javascript 在服务端的运行环境,构建在 chrome 的 V8 引擎之上,基于事件驱动、非阻塞I/O模型,充分利用操作系统提供的异步 I/O 进行多任务的执行,适合于 I/O 密集型的应用场景,因为异步,程序无需阻塞等待结果返回,而是基于回调通知的机制,原本同步模式等待的时间,则可以用来处理其它任务,

    1. 科普:在 Web 服务器方面,著名的 Nginx 也是采用此模式(事件驱动),避免了多线程的线程创建
    2. 、线程上下文切换的开销,Nginx 采用 C 语言进行编写,主要用来做高性能的 Web 服务器,
    3. 不适合做业务。

    Web业务开发中,如果你有高并发应用场景那么 Node.js 会是你不错的选择。
    在单核 CPU 系统之上我们采用 单进程 + 单线程 的模式来开发。在多核 CPU 系统之上,可以通过 child_process.fork 开启多个进程(Node.js 在 v0.8 版本之后新增了Cluster 来实现多进程架构) ,即 多进程 + 单线程 模式。注意:开启多进程不是为了解决高并发,主要是解决了单进程模式下 Node.js CPU 利用率不足的情况,充分利用多核 CPU 的性能。

    Node.js 中的进程

    Node.js 中的进程 Process 是一个全局对象,无需 require 直接使用,给我们提供了当前进程中的相关信息。官方文档提供了详细的说明,感兴趣的可以亲自实践下 Process 文档。

  • process.env:环境变量,例如通过 process.env.NODE_ENV 获取不同环境项目配置信息

  • process.nextTick:这个在谈及 Event Loop 时经常为会提到
  • process.pid:获取当前进程id
  • process.ppid:当前进程对应的父进程
  • process.cwd():获取当前进程工作目录,
  • process.platform:获取当前进程运行的操作系统平台
  • process.uptime():当前进程已运行时间,例如:pm2 守护进程的 uptime 值
  • 进程事件:process.on(‘uncaughtException’, cb) 捕获异常信息、process.on(‘exit’, cb)进程推出监听
  • 三个标准流:process.stdout 标准输出、process.stdin 标准输入、process.stderr 标准错误输出
  • process.title 指定进程名称,有的时候需要给进程指定一个名称

以上仅列举了部分常用到功能点,除了 Process 之外 Node.js 还提供了 child_process 模块用来对子进程进行操作,在下文 Nodejs进程创建会继续讲述。

Node.js 进程创建

进程创建有多种方式,本篇文章以child_process模块和cluster模块进行讲解。

child_process模块

child_process 是 Node.js 的内置模块,官网地址:
child_process 官网地址:nodejs.cn/api/child_p…
几个常用函数: 四种方式

  • child_process.spawn():适用于返回大量数据,例如图像处理,二进制数据处理。
  • child_process.exec():适用于小量数据,maxBuffer 默认值为 200 * 1024 超出这个默认值将会导致程序崩溃,数据量过大可采用 spawn。
  • child_process.execFile():类似 child_process.exec(),区别是不能通过 shell 来执行,不支持像 I/O 重定向和文件查找这样的行为
  • child_process.fork(): 衍生新的进程,进程之间是相互独立的,每个进程都有自己的 V8 实例、内存,系统资源是有限的,不建议衍生太多的子进程出来,通长根据系统 CPU 核心数设置。
    1. CPU 核心数这里特别说明下,fork 确实可以开启多个进程,但是并不建议衍生出来太多的进程,
    2. cpu核心数的获取方式const cpus = require('os').cpus();,这里 cpus 返回一个对象数组,
    3. 包含所安装的每个 CPU/内核的信息,二者总和的数组哦。假设主机装有两个cpu,每个cpu4个核,
    4. 那么总核数就是8
    fork开启子进程 Demo
    fork开启子进程解决文章起初的计算耗时造成线程阻塞。 在进行 compute 计算时创建子进程,子进程计算完成通过 send 方法将结果发送给主进程,主进程通过 message 监听到信息后处理并退出。
    fork_app.js ```javascript const http = require(‘http’); const fork = require(‘child_process’).fork;

const server = http.createServer((req, res) => { if(req.url == ‘/compute’){ const compute = fork(‘./fork_compute.js’); compute.send(‘开启一个新的子进程’);

  1. // 当一个子进程使用 process.send() 发送消息时会触发 'message' 事件
  2. compute.on('message', sum => {
  3. res.end(`Sum is ${sum}`);
  4. compute.kill();
  5. });
  6. // 子进程监听到一些错误消息退出
  7. compute.on('close', (code, signal) => {
  8. console.log(`收到close事件,子进程收到信号 ${signal} 而终止,退出码 ${code}`);
  9. compute.kill();
  10. })
  11. }else{
  12. res.end(`ok`);
  13. }

}); server.listen(3000, 127.0.0.1, () => { console.log(server started at http://${127.0.0.1}:${3000}); });

  1. fork_compute.js<br />针对文初需要进行计算的的例子我们创建子进程拆分出来单独进行运算。
  2. ```javascript
  3. const computation = () => {
  4. let sum = 0;
  5. console.info('计算开始');
  6. console.time('计算耗时');
  7. for (let i = 0; i < 1e10; i++) {
  8. sum += i
  9. };
  10. console.info('计算结束');
  11. console.timeEnd('计算耗时');
  12. return sum;
  13. };
  14. process.on('message', msg => {
  15. console.log(msg, 'process.pid', process.pid); // 子进程id
  16. const sum = computation();
  17. // 如果Node.js进程是通过进程间通信产生的,那么,process.send()方法可以用来给父进程发送消息
  18. process.send(sum);
  19. })

cluster模块

cluster 开启子进程Demo