【Node.js】worker_threads 多线程

Node.js 中的 worker_threads 模块

worker_threads 模块是 Node.js 中用于创建多线程处理的工具。

尽管 JavaScript 是单线程的,但有时候在处理计算密集型任务或长时间运行的操作时,单线程的运行会导致主线程被阻塞,影响服务器性能。

为了解决这种问题,worker_threads 模块允许我们在同一个进程内创建并运行多个线程,每个线程有自己的事件循环,但共享进程的内存空间。

基本概念

  • 主线程:主线程是 Node.js 程序默认执行代码的地方,通常是单线程运行,执行同步和异步的事件循环。
  • Worker(工作线程):工作线程是与主线程平行执行的额外线程,用于处理复杂、长时间运行的任务,不会阻塞主线程的执行。

何时使用 worker_threads

  • 当需要处理 CPU 密集型 任务(如大型计算、图像处理、数据加密等)时。
  • 当需要保持 异步 I/O 操作的同时,不阻塞主线程时。

基本使用方法

1. 创建一个简单的 Worker

我们可以通过 Worker 类创建工作线程。每个工作线程运行一个独立的 JavaScript 文件。

javascript 复制代码
// main.js
const { Worker } = require('worker_threads');

// 创建一个新的 Worker,并指定 worker 执行的脚本文件
const worker = new Worker('./worker.js');

// 监听 worker 发回的消息
worker.on('message', (message) => {
  console.log(`Received from worker: ${message}`);
});

// 向 worker 发送消息
worker.postMessage('Start task');

// worker.js
const { parentPort } = require('worker_threads');

// 监听来自主线程的消息
parentPort.on('message', (message) => {
  console.log(`Worker received: ${message}`);
  
  // 进行一些耗时操作
  let result = 0;
  for (let i = 0; i < 1e9; i++) {
    result += i;
  }
  
  // 将结果发回主线程
  parentPort.postMessage(result);
});

在这个例子中,主线程(main.js)创建了一个 Worker 线程(worker.js),并通过 parentPort 与其通信。主线程可以向 Worker 发送任务,Worker 在处理完后将结果返回给主线程。

2. 数据通信

主线程和 Worker 通过 postMessage()message 事件来传递数据。可以发送任意可以序列化的 JavaScript 数据类型,如字符串、对象、数组等。

  • 主线程向 Worker 发送消息
javascript 复制代码
worker.postMessage('Some data');
  • Worker 向主线程发送消息
javascript 复制代码
parentPort.postMessage('Some result');

3. 共享内存(SharedArrayBuffer)

worker_threads 支持通过 SharedArrayBuffer 来在多个线程之间共享内存。这种机制可以避免频繁的消息传递开销,提高性能。

javascript 复制代码
// main.js
const { Worker } = require('worker_threads');

const sharedBuffer = new SharedArrayBuffer(4);  // 分配 4 字节的共享内存
const sharedArray = new Int32Array(sharedBuffer);

const worker = new Worker('./worker.js', { workerData: sharedBuffer });

worker.on('message', () => {
  console.log('Modified shared array:', sharedArray);
});

// worker.js
const { parentPort, workerData } = require('worker_threads');

const sharedArray = new Int32Array(workerData);

// 修改共享数组
sharedArray[0] = 42;

parentPort.postMessage('Shared data modified');

这里,SharedArrayBuffer 是共享内存的核心,它允许主线程和 Worker 线程访问相同的内存空间。我们用 Int32Array 对内存进行操作,修改数据后,主线程可以立即读取结果,无需通过消息传递。

4. 工作线程与主线程的生命周期

  • 启动和终止

    • 当创建一个 Worker 实例时,线程会自动启动。
    • 当 Worker 执行完所有任务或调用 worker.terminate() 时,线程会退出。
  • 自动终止

    如果工作线程的事件循环为空(没有待处理的事件),Worker 会自动退出。

javascript 复制代码
worker.terminate().then(() => {
  console.log('Worker terminated');
});

5. 错误处理

在多线程环境下,处理错误尤为重要。我们可以使用 error 事件来捕获线程中的错误。

javascript 复制代码
worker.on('error', (err) => {
  console.error('Worker error:', err);
});

如果 Worker 出现错误,会触发 error 事件,主线程可以处理这个错误。

Worker 线程池

虽然 worker_threads 允许我们创建多个 Worker,但直接为每个任务创建一个新的 Worker 可能效率较低。为此,我们可以创建一个 线程池,通过复用 Worker 来处理多个任务。

线程池实现(简单示例):

javascript 复制代码
const { Worker } = require('worker_threads');

class ThreadPool {
  constructor(size) {
    this.size = size;
    this.workers = [];
    this.tasks = [];

    // 初始化线程池
    for (let i = 0; i < size; i++) {
      this.workers.push(this.createWorker());
    }
  }

  createWorker() {
    const worker = new Worker('./worker.js');
    worker.on('message', () => {
      this.executeNextTask(worker);
    });
    return worker;
  }

  executeNextTask(worker) {
    if (this.tasks.length === 0) {
      return;
    }
    const task = this.tasks.shift();
    worker.postMessage(task);
  }

  runTask(task) {
    const availableWorker = this.workers.find(w => w.isIdle);

    if (availableWorker) {
      availableWorker.isIdle = false;
      availableWorker.postMessage(task);
    } else {
      this.tasks.push(task);
    }
  }
}

const pool = new ThreadPool(4);

pool.runTask('Task 1');
pool.runTask('Task 2');

在这个简单的示例中,我们创建了一个大小为 4 的线程池,任务可以通过 runTask 方法提交到线程池中。线程池会依次执行任务,并复用空闲的线程。

与其他多线程解决方案的比较

  • child_process 模块 :允许在 Node.js 中创建独立的进程,进程间通过消息传递进行通信,但资源隔离更强,消耗较大。相比之下,worker_threads 在线程间共享内存,创建成本和通信成本较低。
  • 异步操作 :虽然 Node.js 的异步 I/O 可以通过事件驱动模型来处理大量任务,但对于 CPU 密集型任务,异步操作并不适合,此时可以使用 worker_threads 来实现并行计算。

总结

  • worker_threads 是 Node.js 中用于多线程处理的核心工具。
  • 它允许在单个进程内创建多个线程,线程间可以通过消息传递和共享内存进行通信。
  • 非常适合用于处理计算密集型任务,避免主线程的阻塞。
  • 虽然 worker_threads 增强了并行计算的能力,但需要合理管理线程的创建和销毁,避免线程资源的浪费。
相关推荐
ADFVBM11 小时前
【Node.js]
node.js
摆烂式编程11 小时前
node.js 07.npm下包慢的问题与nrm的使用
前端·npm·node.js
东锋1.311 小时前
npm命令与yarn命令的区别
前端·npm·node.js
一纸忘忧17 小时前
Bun 1.2 版本重磅更新,带来全方位升级体验
前端·javascript·node.js
Amy_cx21 小时前
npm install安装缓慢或卡住不动
前端·npm·node.js
m0_748229991 天前
从零到上线:Node.js 项目的完整部署流程(包含 Docker 和 CICD)
docker·容器·node.js
yqcoder1 天前
node.js 文件操作
node.js
木偶☜1 天前
Node.js接收文件分片数据并进行合并处理
服务器·javascript·arcgis·node.js
梦魇梦狸º2 天前
node安装与管理
macos·node.js