【Node.js】worker_threads 多线程

Node.js 中的 worker_threads 模块

worker_threads 模块是 Node.js 中用于创建多线程处理的工具。

尽管 JavaScript 是单线程的,但有时候在处理计算密集型任务或长时间运行的操作时,单线程的运行会导致主线程被阻塞,影响服务器性能。

为了解决这种问题,worker_threads 模块允许我们在同一个进程内创建并运行多个线程,每个线程有自己的事件循环,但共享进程的内存空间。

基本概念

  • 主线程:主线程是 Node.js 程序默认执行代码的地方,通常是单线程运行,执行同步和异步的事件循环。
  • Worker(工作线程):工作线程是与主线程平行执行的额外线程,用于处理复杂、长时间运行的任务,不会阻塞主线程的执行。

何时使用 worker_threads

  • 当需要处理 CPU 密集型 任务(如大型计算、图像处理、数据加密等)时。
  • 当需要保持 异步 I/O 操作的同时,不阻塞主线程时。

基本使用方法

1. 创建一个简单的 Worker

我们可以通过 Worker 类创建工作线程。每个工作线程运行一个独立的 JavaScript 文件。

javascript 复制代码
// main.js
const { Worker } = require('worker_threads');

// 创建一个新的 Worker,并指定 worker 执行的脚本文件
const worker = new Worker('./worker.js');

// 监听 worker 发回的消息
worker.on('message', (message) => {
  console.log(`Received from worker: ${message}`);
});

// 向 worker 发送消息
worker.postMessage('Start task');

// worker.js
const { parentPort } = require('worker_threads');

// 监听来自主线程的消息
parentPort.on('message', (message) => {
  console.log(`Worker received: ${message}`);
  
  // 进行一些耗时操作
  let result = 0;
  for (let i = 0; i < 1e9; i++) {
    result += i;
  }
  
  // 将结果发回主线程
  parentPort.postMessage(result);
});

在这个例子中,主线程(main.js)创建了一个 Worker 线程(worker.js),并通过 parentPort 与其通信。主线程可以向 Worker 发送任务,Worker 在处理完后将结果返回给主线程。

2. 数据通信

主线程和 Worker 通过 postMessage()message 事件来传递数据。可以发送任意可以序列化的 JavaScript 数据类型,如字符串、对象、数组等。

  • 主线程向 Worker 发送消息
javascript 复制代码
worker.postMessage('Some data');
  • Worker 向主线程发送消息
javascript 复制代码
parentPort.postMessage('Some result');

3. 共享内存(SharedArrayBuffer)

worker_threads 支持通过 SharedArrayBuffer 来在多个线程之间共享内存。这种机制可以避免频繁的消息传递开销,提高性能。

javascript 复制代码
// main.js
const { Worker } = require('worker_threads');

const sharedBuffer = new SharedArrayBuffer(4);  // 分配 4 字节的共享内存
const sharedArray = new Int32Array(sharedBuffer);

const worker = new Worker('./worker.js', { workerData: sharedBuffer });

worker.on('message', () => {
  console.log('Modified shared array:', sharedArray);
});

// worker.js
const { parentPort, workerData } = require('worker_threads');

const sharedArray = new Int32Array(workerData);

// 修改共享数组
sharedArray[0] = 42;

parentPort.postMessage('Shared data modified');

这里,SharedArrayBuffer 是共享内存的核心,它允许主线程和 Worker 线程访问相同的内存空间。我们用 Int32Array 对内存进行操作,修改数据后,主线程可以立即读取结果,无需通过消息传递。

4. 工作线程与主线程的生命周期

  • 启动和终止

    • 当创建一个 Worker 实例时,线程会自动启动。
    • 当 Worker 执行完所有任务或调用 worker.terminate() 时,线程会退出。
  • 自动终止

    如果工作线程的事件循环为空(没有待处理的事件),Worker 会自动退出。

javascript 复制代码
worker.terminate().then(() => {
  console.log('Worker terminated');
});

5. 错误处理

在多线程环境下,处理错误尤为重要。我们可以使用 error 事件来捕获线程中的错误。

javascript 复制代码
worker.on('error', (err) => {
  console.error('Worker error:', err);
});

如果 Worker 出现错误,会触发 error 事件,主线程可以处理这个错误。

Worker 线程池

虽然 worker_threads 允许我们创建多个 Worker,但直接为每个任务创建一个新的 Worker 可能效率较低。为此,我们可以创建一个 线程池,通过复用 Worker 来处理多个任务。

线程池实现(简单示例):

javascript 复制代码
const { Worker } = require('worker_threads');

class ThreadPool {
  constructor(size) {
    this.size = size;
    this.workers = [];
    this.tasks = [];

    // 初始化线程池
    for (let i = 0; i < size; i++) {
      this.workers.push(this.createWorker());
    }
  }

  createWorker() {
    const worker = new Worker('./worker.js');
    worker.on('message', () => {
      this.executeNextTask(worker);
    });
    return worker;
  }

  executeNextTask(worker) {
    if (this.tasks.length === 0) {
      return;
    }
    const task = this.tasks.shift();
    worker.postMessage(task);
  }

  runTask(task) {
    const availableWorker = this.workers.find(w => w.isIdle);

    if (availableWorker) {
      availableWorker.isIdle = false;
      availableWorker.postMessage(task);
    } else {
      this.tasks.push(task);
    }
  }
}

const pool = new ThreadPool(4);

pool.runTask('Task 1');
pool.runTask('Task 2');

在这个简单的示例中,我们创建了一个大小为 4 的线程池,任务可以通过 runTask 方法提交到线程池中。线程池会依次执行任务,并复用空闲的线程。

与其他多线程解决方案的比较

  • child_process 模块 :允许在 Node.js 中创建独立的进程,进程间通过消息传递进行通信,但资源隔离更强,消耗较大。相比之下,worker_threads 在线程间共享内存,创建成本和通信成本较低。
  • 异步操作 :虽然 Node.js 的异步 I/O 可以通过事件驱动模型来处理大量任务,但对于 CPU 密集型任务,异步操作并不适合,此时可以使用 worker_threads 来实现并行计算。

总结

  • worker_threads 是 Node.js 中用于多线程处理的核心工具。
  • 它允许在单个进程内创建多个线程,线程间可以通过消息传递和共享内存进行通信。
  • 非常适合用于处理计算密集型任务,避免主线程的阻塞。
  • 虽然 worker_threads 增强了并行计算的能力,但需要合理管理线程的创建和销毁,避免线程资源的浪费。
相关推荐
Q_Q196328847510 小时前
python+django/flask+vue的多媒体素材管理系统
spring boot·python·django·flask·node.js·php
Q_Q51100828512 小时前
python+django/flask+vue的基于疫情防控管理系统的数据可视化分析系统
spring boot·python·django·flask·node.js
前端fighter13 小时前
全栈项目:闲置二手交易系统(二)
前端·vue.js·node.js
克里斯蒂亚诺更新16 小时前
登录接口思路和开发
node.js
Q_Q51100828516 小时前
python+django/flask医药垃圾分类管理系统
spring boot·python·django·flask·node.js·php
韩立学长16 小时前
【开题答辩实录分享】以《基于Vue Node.js的露营场地管理系统的设计与实现》为例进行选题答辩实录分享
数据库·vue.js·node.js
Q_Q51100828517 小时前
python+django/flask创新型产品提前购系统
spring boot·python·django·flask·node.js·php
Q_Q196328847517 小时前
python+django/flask+vue的基于协同过滤算法的体育商品推荐系统
spring boot·python·django·flask·node.js·php
zhz521418 小时前
重构与集成的诱惑
ai·重构·node.js·vue·持续集成·结对编程
Q_Q51100828518 小时前
python+django/flask+vue的基于文学创作的社交论坛系统
spring boot·python·django·flask·node.js·php