Linux killall 命令详解：按进程名批量终止进程的原理与实践

摘要：killall 是 Linux 中通过进程名批量终止进程的实用命令。本文从 kill 与 killall 的区别入手，深入讲解其遍历 /proc、名称匹配、发送信号的底层原理，详解常用参数，并结合 Node.js 服务重启、僵尸进程清理等实战场景给出使用建议，最后用 JavaScript 模拟了核心逻辑，帮助读者彻底掌握这一运维利器。

日常运维中，你可能遇到过这样的场景：一个 Node.js 服务起了十几个子进程，你想一次性全部关掉。用 kill 的话得一个一个查 PID 再杀，非常繁琐。这时候 killall 就派上用场了------它允许你直接用进程名来终止进程，省去了查 PID 的步骤。

killall vs kill：到底有什么区别

kill 和 killall 虽然名字很像，但工作方式完全不同：

kill ：通过 PID （进程 ID）来终止进程，每次只能杀一个（除非用 kill -9 PID1 PID2）
killall ：通过 进程名 来匹配并终止所有同名进程

bash 复制代码

# kill 的用法：必须先查 PID
ps aux | grep nginx
kill -9 1234 5678

# killall 的用法：直接用名字
killall nginx

看起来只是省了一步，但在实际运维中，这个区别非常大。尤其是当你面对几十个同名 worker 进程的时候。

底层实现原理

killall 的核心逻辑其实不复杂，大致分三步：

第一步：扫描 /proc 文件系统

Linux 的 /proc 目录是内核暴露进程信息的接口。每个进程在 /proc 下都有一个以 PID 命名的目录：

复制代码

/proc/1/
/proc/2/
/proc/1234/

killall 会遍历 /proc 下所有数字目录，读取每个进程的 /proc/{pid}/comm 或 /proc/{pid}/cmdline 文件来获取进程名。

bash 复制代码

# 查看某个进程的名称
cat /proc/1234/comm
# 输出：nginx

# 查看完整命令行
cat /proc/1234/cmdline | tr '\0' ' '
# 输出：nginx: worker process

第二步：名称匹配

拿到进程名后，killall 将其与用户指定的名称进行匹配。这里有个细节------匹配的是 comm（进程名，通常取命令的第一个字段，最长 15 个字符），而不是完整命令行。

bash 复制代码

# 启动一个进程
python3 /path/to/my_script.py &

# comm 文件中存的是 "python3"，不是完整路径
cat /proc/$!/comm
# 输出：python3

所以 killall python3 能匹配到它，但 killall my_script.py 不行。

第三步：发送信号

匹配成功后，killall 调用 kill() 系统调用向目标进程发送信号。默认发送 SIGTERM（15），可以理解为"请优雅退出"。如果进程不听话，就用 SIGKILL（9）强制终止：

bash 复制代码

# 先礼貌地请求退出
killall nginx

# 如果没反应，强制杀
killall -9 nginx

常用参数详解

killall 的参数不多，但有几个特别实用：

bash 复制代码

# -e：精确匹配进程名（默认是模糊匹配）
killall -e node
# 只匹配名为 "node" 的进程，不匹配 "nodejs"

# -I：忽略大小写
killall -I NGINX
# 可以匹配到 "nginx"

# -u：按用户过滤
killall -u www-data nginx
# 只杀 www-data 用户下的 nginx 进程

# -r：使用正则表达式匹配
killall -r 'python.*worker'
# 匹配所有 python 开头且包含 worker 的进程

# -o, -y：按运行时间过滤
killall -o 30m node
# 杀掉运行超过 30 分钟的 node 进程

killall -y 5s node
# 杀掉运行不到 5 秒的 node 进程（防止误杀刚启动的）

# -i：交互模式，杀之前确认
killall -i python3
# 会逐个询问：Kill python3(1234)? (y/n)

# -l：列出所有可用信号
killall -l

实战场景

场景一：重启 Node.js 服务

开发时经常起多个 node 进程，重启前需要全部杀掉：

bash 复制代码

# 查看当前所有 node 进程
killall -e node

# 等一秒确保进程退出
sleep 1

# 重新启动
npm start

场景二：清理僵尸进程

有时候子进程没被正确回收，变成僵尸进程（状态为 Z）：

bash 复制代码

# 查看僵尸进程
ps aux | grep 'Z'

# 用 killall 清理（对僵尸进程可能无效，需要杀父进程）
killall -9 defunct_parent

场景三：按用户清理

多用户环境下，某个用户的进程失控：

bash 复制代码

# 杀掉 testuser 的所有 python 进程
killall -u testuser python3

注意事项和坑

1. 进程名截断问题

Linux 的 comm 字段最长 15 个字符。如果你的进程名超过这个长度，会被截断：

bash 复制代码

# 启动一个长名称进程
./very_long_process_name_that_exceeds_fifteen_chars &

# 实际存储的名称被截断
cat /proc/$!/comm
# 输出：very_long_proces

这时候 killall very_long_process_name 会找不到进程，需要用截断后的名称或者用 -r 正则匹配。

2. 不同系统的 killall 行为不同

macOS 的 killall 和 Linux 的行为有差异。macOS 版本还支持按用户杀所有进程（killall -u username），但 Linux 版本需要配合 -u 指定进程名。跨平台脚本中要注意这一点。

3. pkill 和 pgrep 的替代方案

如果你需要更灵活的进程匹配，pkill 是更好的选择：

bash 复制代码

# pkill 支持完整命令行匹配
pkill -f "python.*my_script"

# pgrep 先查看会匹配到哪些进程
pgrep -f "python.*my_script"
# 输出：1234 5678

# 确认无误后再杀
pkill -f "python.*my_script"

用 JavaScript 模拟 killall 的核心逻辑

如果你想在 Node.js 中实现类似功能，核心就是遍历 /proc 并匹配进程名：

javascript 复制代码

const fs = require('fs')
const path = require('path')

function killall(processName, signal = 'SIGTERM') {
  const procDir = '/proc'
  const entries = fs.readdirSync(procDir)

  for (const entry of entries) {
    // 只处理数字目录（PID）
    if (!/^\d+$/.test(entry)) continue

    const commPath = path.join(procDir, entry, 'comm')
    try {
      const comm = fs.readFileSync(commPath, 'utf-8').trim()
      if (comm === processName) {
        process.kill(parseInt(entry), signal)
        console.log(`已向进程 ${entry} (${comm}) 发送 ${signal}`)
      }
    } catch (e) {
      // 进程可能在读取期间已退出，忽略
    }
  }
}

// 使用示例
killall('nginx')
killall('node', 'SIGKILL')

这段代码做了三件事：遍历 /proc、读取 comm 文件、调用 process.kill() 发送信号。和真正的 killall 命令逻辑基本一致。

总结

killall 是 Linux 进程管理中一个非常实用的命令，特别适合需要批量终止同名进程的场景。理解它的底层原理------遍历 /proc、匹配进程名、发送信号------能帮助你在遇到问题时快速定位原因。

更多 Linux 命令参考，可以查看 Linux 命令参考指南。

相关工具：Linux 进程监控命令 | Linux kill 进程管理