引言
Node.js中的
cluster
模块允许您轻松创建共享服务器端口的子进程。这是一个核心模块,用于在Node.js应用程序中实现多进程架构,以充分利用多核CPU系统的计算能力。
cluster介绍
当您启动一个Node.js应用程序时,默认情况下它运行在单个进程中。对于多核CPU系统来说,这意味着您可能没有充分利用系统的全部潜力。通过使用cluster
模块,您可以启动一个主进程(通常称为"master"或"主"进程),它可以分叉多个工作进程("workers"或"工作进程"),每个工作进程都是应用程序的一个实例,运行在自己的进程中。
主进程不负责处理实际的工作负载,而是负责监控和管理工作进程。例如,它可以根据需要创建新的工作进程或替换已经崩溃的工作进程。这样,即使某个工作进程崩溃,整个应用程序也可以继续运行。
cluster
模块的基本使用步骤如下:
- 引入
cluster
模块。 - 使用
cluster.isMaster
属性检查当前进程是否是主进程。 - 在主进程中,使用
cluster.fork()
方法创建工作进程。 - 设置必要的事件监听,以便于主进程可以响应工作进程的启动、退出等事件。
- 在工作进程中,编写实际处理客户端请求的代码。
使用cluster
模块的好处包括:
- 提高性能:通过在多个核心上并行运行,可以更有效地利用服务器的硬件资源。
- 提高可靠性:如果一个工作进程崩溃,它可以被新的工作进程替换,而不会影响其他工作进程或主进程。
- 负载分配:Node.js的
cluster
模块可以在工作进程之间自动分配连接,以实现负载均衡。
基础使用
使用 cluster
模块来创建一个能够处理多核 CPU 的服务器。
javascript
// 导入http和cluster模块
const http = require('http');
const cluster = require('cluster');
const numCPUs = require('os').cpus().length; // 获取CPU的核心数
if (cluster.isMaster) {
console.log(`主进程 ${process.pid} 正在运行`);
// 衍生工作进程。
for (let i = 0; i < numCPUs; i++) {
cluster.fork();
}
cluster.on('exit', (worker, code, signal) => {
console.log(`工作进程 ${worker.process.pid} 已退出`);
});
} else {
// 工作进程可以共享任何TCP连接。
// 在本例中,它是一个HTTP服务器
http.createServer((req, res) => {
res.writeHead(200);
res.end('Hello World!');
}).listen(3000);
console.log(`工作进程 ${process.pid} 已启动`);
}
代码解释:
- 引入模块 : 引入
http
,cluster
, 和os
模块。 - 主进程与工作进程逻辑 : 使用
cluster.isMaster
来区分代码执行是在主进程还是工作进程中。 - 主进程逻辑 :
- 主进程负责打印当前进程的 PID,并根据 CPU 核心数衍生相应数量的工作进程。
- 监听
exit
事件以打印退出的工作进程信息。
- 工作进程逻辑 :
- 每个工作进程都设置了一个 HTTP 服务器监听同一个端口(3000端口)。
- 工作进程的启动会被记录在日志中。
使用这种方法,Node.js 应用可以有效地利用多核 CPU,提高应用的处理能力和响应速度。
进阶使用:零停机重启
javascript
const http = require("http");
const cluster = require("cluster");
const os = require("os");
//cpu数量(几核)
const cpus = os.cpus().length;
// console.log(`Clustering to ${cpus} CPUS`);
var express = require("express")();
//主进程
if (cluster.isMaster) {
console.log("master process id :", process.pid);
for (let i = 0; i < cpus; i++) {
//分派子进程
cluster.fork();
}
//服务器收到这个消息,退出任务
process.on("SIGINT", function () {
console.log("ctrl+c");
process.exit();
});
express.listen(9000);
// 当主进程收到指定消息时(访问restart),开始"零停机重启"操作。
express.get("/restart", function (req, res, next) {
const workers = Object.keys(cluster.workers);
// console.log('workers',workers)
//重启函数
function restart_worker(i) {
if (i >= workers.length) return;
//第i个工作进程
var worker = cluster.workers[workers[i]];
console.log(`Stoping worker:${worker.process.pid}`);
//中断工作进程
worker.disconnect();
//工作进程退出时
worker.on("exit", function () {
//启动工作进程
const new_worker = cluster.fork();
//当新的工作进程,准备好,并开始监听新的连接时,迭代重启下一个工作子进程
new_worker.on("listening", function () {
restart_worker(i + 1);
})
});
}
//重启第一个工作进程
restart_worker(0);
res.end("restart ok");
});
} else {
//子进程执行内容
const pid = process.pid;
http.createServer(function (req, res) {
console.log(`Handing request from ${pid}`);
res.end(`Hello from ${pid}\n`);
}).listen(8000, function () {
console.log(`Started ${pid}`);
})
}
代码解析:
集群主进程用express
提供web
服务;
集群子工作进程用http
提供web
服务;
当主进程收到指定消息时(访问restart
路径),开始"零停机重启
"操作。
实现重点
是:停掉一个工作进程,并重启一个新的工作进程,当新的工作进程启动好,并进入监听状态时(即:可正常提供Web服务时),再重启下一个工作进程,直到全部重启完成。
执行效果:
为了更直观展示效果
加入一行代码:
javascript
http.createServer(function (req, res) {
console.log(`Handing request from ${pid}`);
res.end(`Hello from ${pid}\n`);
}).listen(8000, function () {
console.log(`Started ${pid}`);
console.log(`${pid} hello 7777777777777777777777`)
})
此时先启动
服务:
bash
node test25
再次修改代码:
javascript
http.createServer(function (req, res) {
console.log(`Handing request from ${pid}`);
res.end(`Hello from ${pid}\n`);
}).listen(8000, function () {
console.log(`Started ${pid}`);
console.log(`${pid} hello 8888888888888888888888`)
})
通过网页打开http://localhost:9000/restart
触发重启:
结果:
总结
需要注意的是,cluster
模块并不是万能的。例如,在有状态的应用程序中,您可能需要考虑如何在工作进程之间共享状态。此外,如果您的应用程序主要受到I/O
限制而不是CPU
限制,那么增加更多的工作进程可能不会带来太大的性能提升。