目录
[1. 进程是什么?PCB 与 task_struct](#1. 进程是什么?PCB 与 task_struct)
[2. 如何查看进程](#2. 如何查看进程)
[3. 通过系统调用获取进程标识符](#3. 通过系统调用获取进程标识符)
[4. fork:创建新进程](#4. fork:创建新进程)
1. 进程是什么?PCB 与 task_struct
课本上说,进程是程序的一次执行实例。从内核的视角,进程就是分配系统资源(CPU 时间、内存等)的实体。
在 Linux 内核中,进程的所有信息都存放在一个叫做 PCB (Process Control Block,进程控制块)的数据结构里。Linux 的 PCB 实现是 task_struct ,定义在 <linux/sched.h> 中。每创建一个进程,内核就分配一个 task_struct,并把它的指针加入链表,由此实现对进程的管理。
task_struct 包含了极其丰富的信息,大致可以分为几类:
-
标识符:进程 ID(PID),父进程 ID(PPID),是进程的唯一编号。
-
状态:进程处于运行、睡眠、停止等状态。
-
优先级:决定调度时的先后顺序。
-
程序计数器:指向下一条将要执行的指令地址。
-
内存指针:指向代码段、数据段、堆栈等。
-
上下文数据:进程切换时,CPU 寄存器的内容保存在这里。
-
I/O 状态:打开的文件列表、分配的 I/O 设备等。
-
记账信息:累计使用 CPU 的时间、时钟数等。
在系统中,所有 task_struct 通过双链表连接,内核可以遍历、查找、调度任何一个进程。
2. 如何查看进程
第一种方式:通过 /proc 虚拟文件系统。/proc 下的每个以数字命名的目录对应一个进程的 PID,里面包含了该进程的所有内核信息。
bash
ls /proc/1 # 查看 PID 为 1 的进程信息
cat /proc/1/status
第二种方式:使用用户级工具 ps 和 top。
bash
ps aux # 显示所有进程详细信息
ps -l # 显示 PID、PPID、PRI、NI 等字段
top # 动态刷新,按 CPU 或内存排序
通过 ps -l 可以看到 UID、PID、PPID、PRI(优先级)、NI(nice 值)等关键字段,后面讲优先级时会用到这些概念。
3. 通过系统调用获取进程标识符
cpp
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main() {
printf("pid: %d\n", getpid()); // 当前进程 ID
printf("ppid: %d\n", getppid()); // 父进程 ID
return 0;
}
每个进程都有一个父进程,除了 init(或 systemd)是进程树的根。父子关系是进程管理的关键线索。
4. fork:创建新进程
在 Linux 下,新进程只能通过复制现有进程来创建。fork() 系统调用就是做这件事。
cpp
pid_t id = fork();
if (id == -1) {
perror("fork");
} else if (id == 0) {
// 子进程
printf("child: pid=%d, ppid=%d\n", getpid(), getppid());
} else {
// 父进程
printf("parent: pid=%d, child=%d\n", getpid(), id);
}
fork 调用一次,返回两次------父进程中返回子进程的 PID,子进程中返回 0。这是一个让初学者困惑的地方,后续讲虚拟地址空间时会理解底层的写时拷贝机制如何支持这一点。
父子进程共享代码段,数据段采用写时拷贝:只有当一方尝试修改数据时,内核才复制一份私有的物理页。这种设计既保证了进程独立性,又避免了一开始就全量拷贝的浪费。
fork 之后通常需要用 if 分流来区分父子逻辑。如果不分流和不控制退出顺序,很容易造成僵尸进程或孤儿进程,这在下一篇详细展开。