『Python底层原理』--CPython的变量实现机制

Python中,变量的使用看起来非常简单,例如 a = 10s = "hello"等等。

然而,这种简单的赋值操作背后,CPython其实做了很多复杂的工作。

本文将通过一些简单易懂的代码示例,一起探索Python变量背后的奥秘,让我们对它的实现机制有更深一步的理解。

1. 变量到底是什么?

Python中,变量本质上是一个名字到值的映射。

例如,当你写a = 1时,a是一个名字,而1是一个值。

CPython会将这个名字 关联起来,以便你后续可以通过名字 访问这个

python 复制代码
a = 1
print(a)  # 输出:1

这种映射关系是通过一个名为命名空间的结构实现的。

命名空间是一个字典,其中的键是变量名,值是变量对应的对象。

它的定义可参考CPython源码中的Include/internal/pycore_frame.h文件。

c 复制代码
typedef struct _PyInterpreterFrame {
    // 省略... ...
    PyObject *f_globals; /* Borrowed reference. Only valid if not on C stack */
    PyObject *f_builtins; /* Borrowed reference. Only valid if not on C stack */
    PyObject *f_locals; /* Strong reference, may be NULL. Only valid if not on C stack */
    // 省略... ...
}

其中,f_locals 保存局部变量映射,函数执行时,局部变量值存于此;

f_globals 用于全局变量,模块级代码块执行时,f_globals 指向模块全局命名空间字典;

f_builtins 关联内置命名空间。

2. 变量的底层实现:字节码

CPython在执行代码时,会先将代码编译成字节码,然后由虚拟机执行这些字节码。我们可以通过 dis 模块查看代码的字节码。

例如,对于a = 1,字节码如下:

python 复制代码
import dis

code = """
a = b
"""
dis.dis(code)
  • LOAD_NAME:从命名空间中加载变量b的值
  • STORE_NAME:将值存储到变量a

这两个指令展示了CPython如何处理变量的读取和赋值。

3. 命名空间与作用域

Python中的变量存储在不同的命名空间中,而这些命名空间又与代码的作用域相关,作用域决定了变量的可见性。

Python有三种主要的作用域:

  1. 局部作用域:函数内部的变量
  2. 全局作用域:模块级别的变量
  3. 内置作用域:包含内置函数和类型的命名空间
python 复制代码
x = "global"  # 全局变量

def func():
    y = "local"  # 局部变量
    print(x)  # 输出:global
    print(y)  # 输出:local

func()

在这个例子中,x是全局变量,y是局部变量。

如果在函数中尝试访问一个未定义 的变量,CPython会按照以下顺序查找:

  1. 局部命名空间(f_locals

  2. 全局命名空间(f_globals

  3. 内置命名空间(f_builtins

如果仍然找不到,就会抛出NameError异常。

4. 不同变量的字节码

CPython为不同作用域的变量提供了不同的字节码指令,以优化性能和实现特定的行为。

4.1. 局部变量

在函数中,局部变量使用LOAD_FASTSTORE_FAST指令。

这些指令直接操作一个数组,而不是字典,因此速度更快。

python 复制代码
def func():
    a = 1  # STORE_FAST
    b = a  # LOAD_FAST
    return b

dis.dis(func)

4.2. 全局变量

全局变量使用LOAD_GLOBALSTORE_GLOBAL指令。

这些指令会直接操作全局命名空间。

python 复制代码
x = 1

def func():
    global x
    x = 2  # STORE_GLOBAL
    return x  # LOAD_GLOBAL

dis.dis(func)

4.3. 闭包变量

当函数嵌套时,内部函数可以访问外部函数的变量。

这些变量称为闭包变量 ,使用LOAD_DEREFSTORE_DEREF指令。

python 复制代码
def outer():
    x = 1
    def inner():
        return x  # LOAD_DEREF
    return inner

dis.dis(outer)

5. 类中的变量

在类定义中,变量的行为与函数不同。

类定义中的变量使用LOAD_NAMESTORE_NAME指令,因为类的命名空间会动态地与全局命名空间交互。

python 复制代码
x = "global"

class MyClass:
    print(x)  # 使用 LOAD_NAME
    x = "local"
    print(x)  # 使用 LOAD_NAME

MyClass()

输出:

查看指令的话,可以使用:python.exe -m dis .\cpython-variable.py命令。

如果在类中使用嵌套函数,CPython会使用LOAD_CLASSDEREF指令来处理闭包变量。

python 复制代码
class MyClass:
    x = "cell"
    def method(self):
        print(x)  # 使用 LOAD_CLASSDEREF

MyClass().method()

6. 编译器如何选择指令

CPython的编译器会根据变量的作用域和代码块类型选择合适的字节码指令。

例如:

  • 如果变量是局部变量,编译器会生成LOAD_FASTSTORE_FAST
  • 如果变量是全局变量,编译器会生成LOAD_GLOBALSTORE_GLOBAL
  • 如果变量是闭包变量,编译器会生成LOAD_DEREFSTORE_DEREF

7. 总结

Python变量的实现机制比看起来复杂得多,它涉及到字节码指令、命名空间、作用域以及编译器的决策逻辑。

通过理解这些概念,可以更好地掌握Python的变量行为,尤其是在复杂的作用域场景中。

如果对CPython的实现感兴趣,可以进一步阅读其源码中与变量相关的部分。

相关推荐
asheuojj3 分钟前
2026年GEO优化获客效果评估指南:如何精准衡量TOP5关
大数据·人工智能·python
多恩Stone3 分钟前
【RoPE】Flux 中的 Image Tokenization
开发语言·人工智能·python
李日灐6 分钟前
C++进阶必备:红黑树从 0 到 1: 手撕底层,带你搞懂平衡二叉树的平衡逻辑与黑高检验
开发语言·数据结构·c++·后端·面试·红黑树·自平衡二叉搜索树
网安墨雨21 分钟前
Python自动化一------pytes与allure结合生成测试报告
开发语言·自动化测试·软件测试·python·职场和发展·自动化
powerfulhell29 分钟前
寒假python作业5
java·前端·python
铉铉这波能秀36 分钟前
LeetCode Hot100 中 enumerate 函数的妙用(2026.2月版)
数据结构·python·算法·leetcode·职场和发展·开发
毕设源码-赖学姐38 分钟前
【开题答辩全过程】以 基于python的电影推荐系统为例,包含答辩的问题和答案
开发语言·python
敲键盘的生活40 分钟前
MoneyPrinter重构之一:用nicegui调用大模型生成视频文案
python·重构·aigc·ai编程·ai写作
qq_2975746740 分钟前
【实战】POI 实现 Excel 多级表头导出(含合并单元格完整方案)
java·spring boot·后端·excel
小邓睡不饱耶42 分钟前
2026 CSDN榜单封神!3大热门技术+5个大厂案例,新手也能直接抄作业
python·ai