堆与栈：C 语言内存管理的核心概念

理解堆和栈，是 C 语言学习从入门走向深入的分水岭。本文用最直观的方式讲清楚这两个最重要的内存区域。

一、从一个函数调用讲起

先看一段简单的递归代码：

c 复制代码

#include <stdio.h>

int factorial(int n)
{
    if (n == 0)
        return 1;
    
    int result = n * factorial(n - 1);
    return result;
}

int main(void)
{
    int n = 3;
    int result = factorial(n);
    printf("%d! = %d\n", n, result);
    return 0;
}

当程序运行时，函数调用的过程可以用下图表示：

复制代码

调用 factorial(3)
│
├── 调用 factorial(2)
│   │
│   ├── 调用 factorial(1)
│   │   │
│   │   ├── 调用 factorial(0)
│   │   │   └── return 1
│   │   │
│   │   └── return 1 * 1 = 1
│   │
│   └── return 2 * 1 = 2
│
└── return 3 * 2 = 6

栈空间的变化就像一端固定的弹簧：

复制代码

栈底（高地址）
┌─────────────┐
│   main()    │ ← 最先进入
│   的栈帧     │
├─────────────┤
│factorial(3) │ ← 调用时压入
│   的栈帧     │
├─────────────┤
│factorial(2) │ ← 再压入
│   的栈帧     │
├─────────────┤
│factorial(1) │ ← 继续压入
│   的栈帧     │
├─────────────┤
│factorial(0) │ ← 最后压入（栈顶）
│   的栈帧     │
└─────────────┘
栈顶（低地址）← 只能从这一端操作！

随着调用深入，栈向一端生长；随着函数返回，栈向另一端收缩。 这种只能在一端操作的"后进先出"结构，就是栈（Stack）。

二、栈的核心特性

2.1 只能在一端操作

复制代码

     压入（push）→          ← 弹出（pop）
              │                │
    ┌─────────┴─────────┐
    │                   │
    │    栈数据区域       │
    │                   │
    │  只能访问最顶端     │
    │                   │
    └───────────────────┘
           栈底（固定）

你只能操作栈顶的那一个元素。 想要拿到压在中间的数据？先把上面的搬开才行。

这就像一摞盘子------你只能取最上面那个，不能直接从中间抽。

2.2 后进先出（LIFO）

复制代码

压入顺序：A → B → C
弹出顺序：C → B → A

最后进来的，最先出去。

函数调用天然就是这个模式：

main 调 factorial(3)，factorial(3) 调 factorial(2)......
返回时，factorial(2) 必须等 factorial(1) 先返回
最后调用的最先返回

2.3 栈帧：每个函数的"私人空间"

复制代码

一个栈帧通常包含：
┌──────────────────┐
│   返回地址        │ ← 记住调用位置，函数结束好回去
├──────────────────┤
│   参数 n          │ ← 调用时传入的值
├──────────────────┤
│   局部变量 result │ ← 函数内部定义的变量
└──────────────────┘

每个函数调用都会分配一个新的栈帧，函数返回时整个栈帧被释放。

这就是为什么：

局部变量只在函数内有效------它的生命和栈帧绑定
不同函数的局部变量互不干扰------各有各的栈帧
递归的每一层都有独立的参数和变量------每次调用都是新栈帧

三、栈的自动管理

栈完全由编译器自动管理，你不需要写任何代码控制它。

c 复制代码

void func(void)
{
    int x = 10;      // x 被分配在当前栈帧中
    int y = 20;      // y 也被分配在当前栈帧中
    // ... 使用 x 和 y ...
}   // 函数结束，整个栈帧自动释放，x 和 y 消失

优点：

分配和释放极快（就是移动一个寄存器的值）
不需要手动管理，不会忘记释放
内存连续，缓存友好

限制：

大小有限（通常 1MB ~ 8MB），超出会栈溢出
大小必须在编译时确定，不能动态变化
函数返回后数据就没了，不能跨函数使用

四、堆：当栈不够用时

栈很好，但有硬伤：

c 复制代码

// 这个数组需要多大？编译时不知道，取决于用户输入
int n;
scanf("%d", &n);
int arr[n];   // 可变长数组（VLA），但编译器不一定支持，且仍在栈上，容易溢出

我们需要一块：

能在运行时动态决定大小
由程序员手动控制生命周期
可以跨函数传递而不失效

这就是堆（Heap）。

c 复制代码

#include <stdlib.h>

int *create_array(int size)
{
    // 在堆上分配内存，返回指向它的指针
    int *arr = (int *)malloc(size * sizeof(int));
    return arr;  // ✅ 函数返回后，堆上的内存还在！
}

int main(void)
{
    int n;
    scanf("%d", &n);
    
    int *data = create_array(n);
    // 使用 data...
    
    free(data);  // ⚠️ 用完必须手动释放！
    return 0;
}

五、堆与栈的核心对比

特性	栈（Stack）	堆（Heap）
管理方式	编译器自动管理	程序员手动管理（malloc / free）
分配速度	极快（移动寄存器）	较慢（需要查找空闲块）
大小限制	较小（几 MB）	较大（受物理内存限制）
生命周期	函数返回即释放	直到 free 调用才释放
典型大小	几字节到几 KB	几 KB 到几 GB
典型用途	局部变量、函数参数	动态数组、链表、树等
常见问题	栈溢出（无限递归）	内存泄漏（忘记 free）

一句话：

栈上的东西：自动管理，活不久，但快
堆上的东西：手动管理，活得长，但慢

六、内存布局全景图

复制代码

高地址
┌──────────────┐
│   命令行参数   │
│   环境变量     │
├──────────────┤
│              │
│     栈       │ ← 向下生长（地址减小）
│     │        │
│     ↓        │
│              │
│  ────────    │ ← 栈和堆之间的空隙
│              │
│     ↑        │
│     │        │
│     堆       │ ← 向上生长（地址增大）
│              │
├──────────────┤
│   BSS 段     │ ← 未初始化的全局变量
├──────────────┤
│   Data 段    │ ← 已初始化的全局变量
├──────────────┤
│   Text 段    │ ← 程序代码（只读）
└──────────────┘
低地址

栈和堆相向生长，共享中间的空闲空间。 栈用多了往堆的方向长，堆用多了往栈的方向长------当然，撞上了程序就崩了。

七、三种变量存在哪里？

c 复制代码

#include <stdlib.h>

int global_var = 100;          // 数据段（Data）

void func(void)
{
    static int static_var = 0; // 数据段（BSS 或 Data）
    int local_var = 10;        // 栈
    int *heap_var = malloc(4); // heap_var 本身在栈，指向的 4 字节在堆
    
    free(heap_var);
}

变量类型	存储位置	生命周期
局部变量	栈	函数内
malloc 分配的空间	堆	直到 free
全局变量	数据段	整个程序
static 局部变量	数据段	整个程序
字符串字面量	只读数据段	整个程序

八、最重要的三条规则

规则一：绝不返回局部变量的地址

c 复制代码

// ❌ 致命错误
int *create_int(void)
{
    int x = 42;
    return &x;   // x 在栈上，函数返回后栈帧释放！
}

// ✅ 正确：用 malloc 分配在堆上
int *create_int(void)
{
    int *p = malloc(sizeof(int));
    *p = 42;
    return p;    // 堆上的空间，需要调用方 free
}

规则二：malloc 和 free 必须配对

c 复制代码

// 每次 malloc，都要有一条对应的 free
int *p = malloc(100);
// 使用 p...
free(p);     // 别忘了！
p = NULL;    // 好习惯，防止意外使用

规则三：栈值得尊重------别在上面放太重的东西

c 复制代码

// ❌ 坏习惯：巨大的局部数组
void process(void)
{
    int huge_array[10000000];  // 栈溢出！
}

// ✅ 好习惯：大内存用堆
void process(void)
{
    int *huge_array = malloc(10000000 * sizeof(int));
    // 处理...
    free(huge_array);
}

九、总结

栈是函数的呼吸------随着调用深入吸气扩张，随着返回呼气收缩。堆是程序员的广场------想放什么放什么，但用完得自己收拾干净。

理解这两块内存，你就理解了 C 语言内存管理的核心逻辑：

为什么局部变量出了函数就不能用？
为什么递归太深会栈溢出？
为什么 malloc 后的内存要 free？
为什么有些指针返回是安全的，有些不是？

这些问题都能在"它到底在栈上还是堆上"这个框架下得到统一的解答。

如果你觉得这篇文章有帮助，欢迎分享给正在学习 C 语言的朋友。下一篇我们聊聊指针和内存的更深入话题。