GDB 进程概念详解（下篇）—— 多进程与进阶调试能力

引言

在掌握单进程调试的基础上，实际生产环境中还会遇到多进程程序、崩溃转储、信号异常、远程调试等复杂场景。本篇为独立的进阶篇，配套场景示意图与实操案例，系统讲解 GDB 对多进程的管控机制、信号处理逻辑、核心转储分析、进程内存深度操作与远程调试模型，可单独阅读用于进阶场景参考，也可与上篇配合形成完整知识体系。

一、多进程调试机制

1.1 fork 后的进程跟踪策略

当目标程序调用 fork() 创建子进程时，GDB 默认行为由两个配置项决定，这也是多进程调试的核心开关：

follow-fork-mode：决定 fork 后 GDB 继续跟踪父进程还是子进程，可选值为 parent（默认，跟踪父进程）和 child（跟踪子进程）。
detach-on-fork：决定 fork 后是否脱离另一个未被跟踪的进程，可选值为 on（默认，脱离未跟踪进程）和 off（同时保留两个进程的追踪权，可切换调试）。

当 detach-on-fork 设为 off 时，fork 产生的所有子进程都会被 GDB 纳入管控，形成多进程调试会话。

三种跟踪模式示意图 基础场景：父进程调用 fork 生成子进程

plaintext

复制代码

        fork()
父进程 ────────▶ 父进程 + 子进程

默认模式（follow-fork-mode=parent, detach-on-fork=on）

plaintext

复制代码

fork前：GDB → [父进程]
fork后：GDB → [父进程]    [子进程]（不受控，自由运行）

跟踪子进程模式（follow-fork-mode=child, detach-on-fork=on）

plaintext
复制代码
```
fork前：GDB → [父进程]
fork后：[父进程]（脱离）    GDB → [子进程]
```

同时跟踪模式（detach-on-fork=off）

plaintext

复制代码

fork前：GDB → [父进程]
fork后：GDB → [父进程（inferior 1）]
            → [子进程（inferior 2）]
两个进程都被管控，可随时切换

配置命令示例

bash

运行

复制代码

# 设置fork后跟踪子进程
(gdb) set follow-fork-mode child

# 设置fork后不脱离另一个进程，同时管控父子
(gdb) set detach-on-fork off

1.2 多进程查看与切换

在多进程调试会话中，GDB 会为每个被追踪进程分配唯一的 inferior 编号，用于标识不同的进程实例。

查看与切换实操 程序 fork 后，查看所有被管控进程：

bash

运行

复制代码

(gdb) info inferiors
  Num  Description       Executable
* 1    process 12345     ./fork_test
  2    process 12346     ./fork_test

* 号表示当前正在调试的进程。

切换到子进程调试：

bash

运行

复制代码

(gdb) inferior 2
[Switching to inferior 2 [process 12346] (./fork_test)]

切换进程时，当前进程会保持停止态，被切换的目标进程也默认处于停止态，不会自动运行。

1.3 子进程断点继承与隔离

默认情况下，父进程设置的断点不会自动继承到 fork 后的子进程。若需要子进程也命中相同断点，需在切换到子进程后重新设置，或使用 set follow-fork-mode child 并在 fork 前设置断点。

不同 inferior 进程的断点、观察点是相互隔离的，对 A 进程设置的断点不会影响 B 进程的执行。

验证示例 测试代码 fork_test.c：

运行

复制代码

#include <stdio.h>
#include <unistd.h>

void func() {
    printf("pid = %d\n", getpid());
}

int main() {
    pid_t pid = fork();
    func();
    return 0;
}

操作步骤：

fork 前在 func 函数设置断点
配置 set detach-on-fork off
运行程序

结果：父进程命中断点时，子进程不会停止；切换到子进程后，该断点不会自动生效，需要重新设置。

二、进程信号处理机制

2.1 GDB 对信号的拦截逻辑

Linux 系统中，信号是进程间通信与异常通知的核心机制。当目标进程处于被追踪状态时，所有发送给目标进程的信号都会先被 GDB 拦截，由 GDB 决定如何处理：

传递给目标进程，让进程执行自身的信号处理函数；
拦截并丢弃信号，不通知目标进程；
拦截信号并暂停进程，等待用户指令。

信号传递流程图

plaintext

复制代码

外部/内核 发送信号 → 目标进程
                      ↓
                  被GDB拦截
                      ↓
            根据handle规则判断
          ┌───────────┴───────────┐
          ▼                       ▼
      传递给进程               拦截丢弃
    执行信号处理函数         进程感知不到信号
    （可选：暂停进程）

这就是为什么程序自己写了 SIGINT 信号处理函数，但调试时按 Ctrl+C 不会触发程序逻辑 ------ 因为信号默认被 GDB 截走了，用来中断调试进程。

2.2 handle 命令配置信号行为

通过 handle 命令可以自定义 GDB 对指定信号的处理策略，三个核心维度：

stop：收到该信号时是否暂停目标进程；
print：收到该信号时是否在 GDB 控制台打印提示；
pass/nopass：是否将信号传递给目标进程本身。

常用配置示例

让程序自己处理 Ctrl+C，不中断调试

bash

运行
复制代码
```
(gdb) handle SIGINT pass nostop
```
忽略管道破裂信号，不干扰调试

bash

运行
复制代码
```
(gdb) handle SIGPIPE nostop noprint pass
```
段错误时暂停并打印（默认配置，用于定位崩溃）

bash

运行
复制代码
```
(gdb) handle SIGSEGV stop print pass
```

2.3 常见信号的调试注意事项

SIGINT（2 号）：默认被 GDB 捕获用于中断进程，不会传递给目标程序；若程序自身需要处理 SIGINT，需手动配置 pass。
SIGSEGV（11 号） ：段错误信号，触发时进程默认崩溃，GDB 会自动暂停，是定位内存越界、空指针的核心依据。触发时输出示例：

plaintext
复制代码
```
Program received signal SIGSEGV, Segmentation fault.
0x0000000000401132 in main () at crash.c:6
```
SIGSTOP / SIGKILL：这两个信号无法被捕获、阻塞或忽略，GDB 也无法改变其行为。

三、核心转储与崩溃进程分析

3.1 core 文件：进程崩溃的快照

核心转储（Core Dump）是进程异常崩溃时，由内核生成的一个文件，完整保存了崩溃瞬间进程的内存、寄存器、栈帧、线程状态等所有运行数据，相当于进程崩溃时刻的 "快照"。

core 文件生成流程

plaintext

复制代码

进程触发致命信号（如SIGSEGV）
        ↓
内核检查core文件大小限制
        ↓
  允许生成 → 写入进程完整内存快照到core文件
        ↓
进程终止，core文件保留在磁盘

系统默认可能关闭 core 文件生成，需通过命令开启：

bash

运行

复制代码

# 临时开启（当前终端有效）
ulimit -c unlimited
# 验证：输出 unlimited 表示无大小限制
ulimit -c

3.2 加载 core 文件调试

GDB 可以直接加载 core 文件，还原崩溃现场进行离线调试，无需复现崩溃场景：

bash

运行

复制代码

gdb 可执行文件 core文件路径

完整实操示例 崩溃测试代码 crash.c：

运行

复制代码

int main() {
    int *p = 0; // 空指针
    *p = 100;   // 向空指针写数据，触发段错误
    return 0;
}

编译运行生成 core：

bash

运行

复制代码

gcc -g crash.c -o crash
ulimit -c unlimited
./crash
# 输出：Segmentation fault (core dumped)
# 当前目录下生成 core 或 core.PID 文件

加载 core 文件调试：

bash

运行

复制代码

gdb ./crash core

3.3 崩溃现场还原步骤

以上面的空指针崩溃为例，标准分析流程：

定位崩溃位置

bash

运行
复制代码
```
(gdb) bt
#0  0x0000000000401132 in main () at crash.c:3
3	    *p = 100;
```
直接看到崩溃在第 3 行，是空指针赋值导致。
查看异常变量

bash

运行
复制代码
```
(gdb) print p
$1 = (int *) 0x0
```
确认指针 p 是空地址 0x0。
查看寄存器状态

bash

运行
复制代码
```
(gdb) info registers rip
rip            0x401132	0x401132 <main+11>
```
确认崩溃时的指令地址，辅助判断栈溢出、指令越界等问题。

四、进程内存与运行时深度干预

4.1 进程地址空间查看

GDB 可以直接读取目标进程的整个地址空间，常用命令：

查看完整内存映射

bash

运行

复制代码

(gdb) info proc mappings
process 12345
Mapped address spaces:

          Start Addr           End Addr       Size     Offset objfile
            0x400000           0x401000     0x1000        0x0 /home/user/test
            0x401000           0x402000     0x1000     0x1000 /home/user/test
      0x7ffff7a00000     0x7ffff7bc0000   0x1c0000        0x0 /lib/x86_64-linux-gnu/libc.so.6
      0x7ffffffde000     0x7ffffffff000    0x21000        0x0 [stack]

可以清晰看到代码段、数据段、共享库、栈、堆的地址范围。

查看指定内存数据

bash

运行

复制代码

# 按16进制整数查看变量地址的数据
(gdb) x /x &p
0x7fffffffe12c:	0x00000000

# 查看字符串内容
(gdb) x /s str
0x402004:	"hello world"

# 从当前rip开始，查看10条汇编指令
(gdb) x /10i $rip

4.2 运行时修改进程状态

GDB 不仅能查看，还能直接修改目标进程的运行状态，实现运行时干预。所有修改仅作用于当前运行的进程实例，不会修改磁盘上的可执行文件，进程退出后修改失效。

实操示例

修改变量值，临时验证逻辑 场景：不用改代码重编译，直接验证变量修改后的程序行为

bash

运行

复制代码

# 停在test.c第7行时，把y的值从20改成100
(gdb) set var y = 100
(gdb) print y
$1 = 100
# 继续运行后，add函数返回结果会变成 110

手动调用函数

bash

运行

复制代码

# 调试过程中直接调用add函数计算
(gdb) call add(5, 8)
$2 = 13

4.3 进程与线程的关系

一个进程可以包含多个线程，所有线程共享进程的地址空间，但拥有独立的栈与寄存器上下文。GDB 中多线程调试是进程调试的延伸。

进程与线程结构示意图

plaintext

复制代码

┌──────────────────────────────────┐
│           进程地址空间            │
│  代码段、数据段、堆、共享库      │
│  ┌──────┐  ┌──────┐  ┌──────┐  │
│  │线程1 │  │线程2 │  │线程3 │  │
│  │栈+寄存器│ │栈+寄存器│ │栈+寄存器│  │
│  └──────┘  └──────┘  └──────┘  │
└──────────────────────────────────┘

常用命令：

info threads：查看当前进程的所有线程。
thread 编号：切换到指定线程，查看该线程的栈帧与寄存器。
set scheduler-locking on：单步执行时只运行当前线程，其他线程保持暂停，避免多线程竞态干扰调试。

五、远程进程调试

5.1 gdbserver 远程调试模型

当目标程序运行在嵌入式设备、远程服务器或容器中，无法直接在目标环境运行完整 GDB 时，采用GDB + gdbserver的远程调试模型：

目标端运行 gdbserver :端口可执行文件 或 gdbserver --attach :端口 PID，启动轻量调试服务，管控本地进程。
本地 GDB 执行 target remote 目标IP:端口，建立网络连接，所有调试命令通过网络传输到 gdbserver 执行。

远程调试拓扑图

plaintext

复制代码

开发机（本地）                 目标机（远程/嵌入式）
┌──────────┐                  ┌──────────┐
│  GDB     │─── TCP网络 ─────▶│gdbserver │
│（带符号）│                  │（控进程）│
└──────────┘                  └──────────┘

完整操作流程 目标端（IP 192.168.1.100）操作：

bash

运行

复制代码

# 方式1：启动程序并开启调试服务
gdbserver :1234 ./test

# 方式2：附着到已运行进程
gdbserver --attach :1234 8899

本地端操作：

bash

运行

复制代码

gdb ./test
# 连接远程目标
(gdb) target remote 192.168.1.100:1234

5.2 远程进程的调试特点

目标端仅运行轻量的 gdbserver，占用资源极少，适合嵌入式与资源受限环境。
符号文件保存在本地 GDB 侧，目标端无需携带调试符号，减小部署体积。
远程调试的命令逻辑与本地调试完全一致，attach、断点、单步、查看内存等操作均无差异。

下篇总结

本篇通过示意图与场景化实操案例，覆盖了 GDB 进程调试的进阶场景：多进程的跟踪与切换、信号的自定义处理、core 文件的崩溃分析、进程内存的读写干预，以及远程调试模型。这些能力能够应对生产环境中绝大多数复杂调试场景，形成完整的 GDB 进程调试知识体系。
谢谢