CPython 局部变量存储机制：从 “栈上存储“ 看语言实现差异

在 Python 开发中，常听到 局部变量存储在栈上 的说法，但这句话背后的技术细节却与 C/C++ 等语言存在本质区别。理解 CPython 的变量存储机制，不仅能解开这个认知谜团，还能帮助我们写出更高效率的代码。

本文涉及到栈、堆的概念，在《数据结构》教材中有详细讲解，相关这方面的资料请参考博客《CS创新实验室》中的"考研复习408"专栏，此专栏是老齐为考研同学开设的复习专栏，其内容不仅涵盖了考研相关知识，也会结合那些知识，阐述它们在实践中的有关应用。

1. 执行帧：函数运行的 "独立空间"

当 Python 解释器遇到函数调用时，会立即创建一个特殊的 执行帧（Frame）对象。这个对象就像一个独立的工作间，存储着函数运行所需的全部上下文信息。执行帧在计算机的堆内存中动态分配，就像我们在宾馆中开设的临时房间，里面配备了各种设施：

局部变量数组（f_localsplus）：专门存放函数内定义的局部变量和计算过程中产生的临时值，就像房间里的储物柜
字节码指令指针（f_lasti）：记录当前执行到哪条字节码指令，类似音乐播放器的进度指针
命名空间引用：保存对全局变量和内置函数的引用，方便快速查找
求值栈 ：用于表达式计算，比如处理 1+2*3 这样的运算

每个函数调用都会生成新的执行帧，形成调用栈的一个节点。比如调用 main() 函数时创建主帧，调用 foo() 时在主帧之上创建子帧，形成栈状的嵌套结构。

2. 局部变量的 "双重身份"：堆存储与栈逻辑

虽然常说局部变量在"栈上"，实际存储位置却是在堆内存的执行帧对象中。这里的"栈"并非物理内存中的栈空间，而是逻辑上的调用栈 概念。就像图书馆的书架编号系统：

物理存储 ：局部变量存放在帧对象的 f_localsplus 数组里，这个数组位于堆内存，就像书架上的具体格子
逻辑归属：帧对象本身是调用栈的组成部分，调用栈由一系列帧对象通过链表连接而成。当函数返回时，对应的帧对象被销毁，局部变量随之释放，这种"随用随销"的特性符合传统栈变量的生命周期特点

对比全局变量的存储就更清晰了：全局变量存放在模块级的字典中（也是堆内存），但只要模块未被卸载就会一直存在。而局部变量就像临时借用的工具，函数执行完毕就会被"回收"。

3. 与 C/C++ 栈的本质区别

虽然都叫"栈"，但 CPython 和 C/C++ 的实现存在四大关键差异：

特性	CPython 局部变量	C/C++ 局部变量
物理位置	堆内存的帧对象内	CPU 栈内存
分配方式	动态创建帧对象	栈指针直接移动
生命周期	帧对象销毁时释放	函数返回时自动释放
大小确定	字节码生成阶段确定	编译时由类型决定

举个例子：C 语言函数调用时，局部变量直接在栈空间分配，通过调整 ESP 寄存器指针来管理内存；而 Python 则是在堆上创建完整的帧对象，通过对象引用来管理变量。这种差异源于两种语言的设计哲学：C 追求极致的执行效率，Python 则需要支持动态类型和灵活的控制结构。

4. 高效访问的秘密：FAST 系列指令

CPython 的局部变量访问效率其实非常高，秘诀在于 LOAD_FAST 和 STORE_FAST 这两条特殊的字节码指令。当解释器处理以下代码时：

复制代码

def example():
    x = 10    # 编译为 STORE_FAST 0（索引0）
    y = x + 1 # 编译为 LOAD_FAST 0（读取索引0）

会直接通过索引操作 f_localsplus 数组。这种方式就像直接按编号取用储物柜中的物品，省去了查找字典的繁琐过程（全局变量需要通过 LOAD_NAME 指令进行字典查找，涉及哈希计算和键值匹配）。实测显示，局部变量访问速度比全局变量快 5-10 倍，这也是编程中推荐使用局部变量的重要原因。

5. 为什么选择堆内存？动态特性的必然选择

可能有人会问：为什么不直接使用物理栈来存储局部变量呢？这是因为 Python 需要支持这些高级特性：

生成器与闭包 ：生成器函数在 yield 时需要暂停执行，帧对象必须保留状态直到下次调用。如果放在物理栈上，函数返回时栈帧就会销毁，无法实现状态保持。就像视频播放的暂停功能，需要保存当前进度信息。
动态类型支持：Python 变量可以存储任意类型对象，大小动态变化。物理栈需要预先确定内存空间，难以适应这种动态性。堆内存的动态分配特性正好满足需求。

以生成器为例：

复制代码

def gen():
    x = 10
    yield x
g = gen()  # 此时帧对象不会销毁，等待下次调用时继续执行

当调用 gen() 创建生成器对象 g 时，对应的帧对象会在堆内存中持续存在，直到生成器被垃圾回收。这种"暂停---恢复"的能力，正是依赖堆内存的长期存储特性。

6. 关键结论与实践意义

经过以上分析，我们可以给出更准确的表述：CPython 的局部变量存储在堆内存的执行帧对象中，但通过逻辑上的调用栈进行管理，其生命周期与栈帧严格绑定。这里的"栈"指的是函数调用形成的帧嵌套结构，而非物理内存布局。

理解这一机制对实际编程有重要指导意义：

性能优化：尽量使用局部变量，避免频繁访问全局变量（字典查找效率低）
调试技巧：通过sys._getframe()可以获取当前帧对象（调试专用，生产环境避免使用）
内存管理：了解帧对象的生命周期，有助于理解闭包、生成器等特性的内存占用情况

7. 动手验证方法

查看字节码 ：使用 dis 模块查看函数编译后的字节码

复制代码

import dis
dis.dis(lambda: x + 1)  # 输出包含LOAD_FAST指令，证明局部变量访问

帧对象查看（调试场景）：

复制代码

import sys
def foo():
    x = 10
    frame = sys._getframe()
    print(frame.f_localsplus)  # 显示局部变量数组（内部实现细节）

总结：透过现象看本质

"局部变量存储在栈上"这句话，本质上是一种抽象层次的简化表述。CPython 通过执行帧机制，在动态语言特性和执行效率之间找到了巧妙平衡：用堆内存实现灵活的状态保持，用逻辑调用栈模拟传统栈变量的生命周期，通过数组索引实现高效访问。这种设计思想值得每个 Python 开发者深入理解，既能解开日常开发中的困惑，又能在性能优化和调试时做到有的放矢。下次再遇到类似的底层机制问题，记得从语言实现的整体架构出发，就能看清表象下的本质规律。