【Linux 环境变量和地址空间】

一文搞懂 Linux 环境变量与地址空间：fork 后内存为什么互不影响？

很多人学完进程创建之后，仍然会有两个挥之不去的问题。

第一个问题是：为什么我在终端里直接输入程序名就能运行，它到底是怎么被找到的？

第二个问题是：fork() 之后，父子进程看起来好像拿到了同样的变量地址，为什么它们又互不影响？

这两个问题，看似分散，其实都和进程运行时的上下文密切相关。环境变量决定了进程启动时携带什么信息，地址空间则决定了进程运行时如何组织代码和数据。

这篇文章比较适合下面这两类读者：

已经学过 fork()，但对父子进程内存关系还是模糊
知道 PATH、HOME、SHELL，但不清楚它们到底属于什么机制

图 1：用户输入命令后，shell 会结合 PATH 查找可执行文件，并把参数和环境变量一起传给新进程。

一、环境变量到底是什么

环境变量本质上是一组键值对，用来描述进程运行环境。它们通常由 shell 维护，并在创建新进程时传递给子进程。

最常见的几个变量包括：

PATH：告诉 shell 应该去哪些目录查找可执行文件
HOME：当前用户的家目录
SHELL：当前使用的 shell 程序

比如我们平时直接输入一个命令名，shell 之所以能找到它，靠的就是 PATH。

bash 复制代码

echo $PATH

如果某个可执行文件所在目录不在 PATH 中，你通常只能通过相对路径或绝对路径去运行它；把目录追加到 PATH 后，shell 才能"直接认得它"。

二、最常见的环境变量操作

在 Linux 中，操作环境变量最常用的命令有这些：

bash 复制代码

echo $NAME
export MYENV="hello world"
env
unset MYENV
set

其中：

echo 用来查看某个变量
export 用来导出环境变量
env 用来查看当前环境变量
unset 用来删除变量
set 往往还能看到 shell 内部定义的变量

如果你希望某些变量长期生效，通常会写入像 ~/.bashrc 或 ~/.bash_profile 这样的启动脚本中。

三、C 程序如何读取环境变量

在 C 程序里，读取环境变量最直接的方式是 getenv()：

c 复制代码

#include <stdio.h>
#include <stdlib.h>

int main()
{
    printf("%s\n", getenv("PATH"));
    return 0;
}

如果你想读取自定义变量，也同样可以：

c 复制代码

char *env = getenv("MYENV");
if (env) {
    printf("%s\n", env);
}

在运行程序前，先在 shell 中设置：

bash 复制代码

export MYENV="hello world"

程序就能拿到对应值。

除了 getenv()，还有两种理解环境变量来源的方式：

通过 main(int argc, char *argv[], char *env[]) 直接读取
通过外部变量 extern char **environ 访问

这有助于你理解：环境变量并不是"神秘地存在于系统里"，它本质上也是进程启动时收到的一段数据。

四、程序地址空间里都有什么

当一个程序运行起来后，操作系统会为它构建一个进程地址空间。虽然不同平台和内核实现细节并不完全一样，但从学习角度看，我们通常会把它理解为下面几部分：

代码区
已初始化数据区
未初始化数据区
堆
栈
只读常量区
命令行参数和环境变量区域

可以过打印地址的方式，展示了这些区域在虚拟地址空间中的分布。例如：

全局已初始化变量和静态变量通常靠近数据区
malloc 申请出来的内存位于堆
局部变量位于栈
字符串常量通常位于只读区域
argv 和环境变量也会出现在进程地址空间的高地址附近

这种实验特别适合帮助初学者把"地址空间"从抽象名词变成可观察现象。

图 2：把代码区、数据区、堆、栈、argv 和环境变量放到同一张图里看，地址空间就会清晰很多。

五、为什么 fork 后父子进程看到的地址很像

有一个非常经典的实验：在 fork() 之后，父子进程分别打印同一个全局变量的值和地址，结果发现地址看起来一样。

这很容易让人产生误解，以为父子进程还在"共用同一块用户内存"。其实不是。

更准确的理解是：

父子进程在 fork() 之后，会拥有看起来几乎一致的虚拟地址空间布局
所以同一个变量在父子进程里，往往会显示出相同的虚拟地址
但它们已经是两个独立进程，逻辑上各自维护自己的内存语义

当子进程修改变量时，父进程中的值并不会跟着改变。

六、写时拷贝：为什么看起来一样，却又彼此独立

这背后的关键机制，就是写时拷贝，也就是 Copy-On-Write。

图 3：fork() 后父子进程一开始可能共享同一物理页；只有当某一方尝试写入时，内核才会真正复制页面。

它的思路并不复杂：

fork() 之后，父子进程先共享同一份物理内存页
只要双方都只是读取，就没有必要立刻复制整块内存
一旦某一方尝试写入，系统才会为它分配新的物理页

这样做的好处非常明显：

提高 fork() 的效率
避免一开始就进行大规模内存复制
保证父子进程在语义上仍然相互独立

所以，"地址一样"看到的是虚拟地址层面的现象；"修改互不影响"体现的才是进程隔离的本质。

七、从 task_struct 到 mm_struct：内核如何描述地址空间

如果再往内核里走一步，还有两个重要结构：

task_struct：描述进程本身
mm_struct：描述进程的内存管理信息

在 mm_struct 下面，还会进一步管理多个虚拟内存区域，也就是 VMA。每个 VMA 可以对应一段不同属性的地址范围，比如代码段、数据段、堆、栈、映射区等。

这说明一件事：进程的内存布局并不是"随便放在那里"，而是由内核通过一整套结构化数据来描述和维护的。

八、最后

环境变量解决的是"进程带着什么上下文启动"，地址空间解决的是"进程运行时如何组织代码和数据"，而 fork() 与写时拷贝则把两者和进程创建过程真正连到了一起。

当你把这三部分串起来理解，会发现 Linux 系统编程的很多现象都不再神秘：

为什么 shell 能找到命令
为什么程序能读到环境变量
为什么 fork() 后父子进程看起来相似却彼此独立

这也是系统编程学习中非常关键的一步：从"会调用接口"走向"理解接口背后的系统行为"。