前言:你是否有了解过python 最核心、最基础的内存管理机制------引用计数(Reference Counting) 。
1. 监控台:sys.getrefcount 的数字游戏
在 Python 中,每一个对象创建时,都会自带一个名为 ob_refcnt 的属性。这个数字记录了当前有多少个变量(指针)正指向这个对象。
我们通过 sys.getrefcount() 这个"监控摄像头"来观察它的生死时速:
Python
css
import sys
# 1. 创建一个对象
a = [1, 2, 3]
print(sys.getrefcount(a))
实验发现: 你可能以为输出是 1,但实际输出通常是 2。
知识点: sys.getrefcount(a) 在执行时,会将变量 a 作为参数传递给函数。在函数内部,形参也引用了该对象,导致计数临时 +1。所以,实际计数永远比你肉眼看到的变量数多 1。
2. 计数的"时速":谁在拨动数字?
对象的引用计数就像一个不停波动的计数器,以下四种行为是导致计数增加的"四大元凶":
① 赋值操作
Python
ini
a = [1, 2, 3] # 计数从 0 变 1 (加上临时引用共 2)
b = a # 计数再 +1
② 传参
Python
scss
def check(data):
print(sys.getrefcount(data)) # 进入函数,形参引用,计数再 +1
check(a)
③ 放入容器
Python
ini
my_list = [a, a, 123] # a 被两次放入列表,计数 +2
④ 属性绑定
Python
ini
class MyObj: pass
obj = MyObj()
obj.attr = a # 作为对象的属性,计数 +1
3. 计数的"刹车":触发归零的瞬间
当引用计数变为 0 的那一刻,Python 会毫不留情地立即回收该对象占用的内存。这就是对象"死亡"的瞬间。
触发计数减少的操作通常包括:
- 使用
del显式删除 :del a并不是删除对象,而是删除了"指向对象的标签",让计数 -1。 - 变量被重新赋值 :
a = 456,原先[1, 2, 3]的计数 -1。 - 对象离开作用域:这是最常见的场景。当一个函数执行结束,函数内部的所有局部变量会被销毁,它们指向的对象的计数集体 -1。
4. 深度对比:为什么 Python 是"实时回收"?
这是 Python 内存管理最迷人的地方,也是它与 Java、Go 等语言最大的区别。
Python 的"即刻处决"
引用计数机制最大的优点是实时性。一旦计数归零,内存立即释放。
- 优点:内存回收的开销平摊在每一次赋值和销毁中,逻辑简单且极其高效。
- 副作用:你需要频繁地维护这个计数器,这在多线程环境下会带来严重的性能锁竞争(这也是 GIL 存在的理由之一)。
Java 的"等待宣判" (STW)
Java 的垃圾回收主要依赖可达性分析。它不会在引用断开的一瞬间回收内存,而是等到内存压力大到一定程度时,启动 GC 线程。
- STW (Stop The World) :在 Java 进行大规模垃圾回收时,整个应用程序可能会短暂"暂停",等待清洁工打扫完毕。
- 对比:Python 就像是一个每个乘客下车都立刻打扫座位的出租车;而 Java 更像是一辆运行了一整天、回到终点站才统一大扫除的公交车。
5. 引用计数的"死穴":循环引用
引用计数虽然高效,但它有一个致命的逻辑漏洞:它不识"连环计" 。
Python
css
# 构造一个互相伤害的死循环
a = {}
b = {}
a['next'] = b
b['next'] = a
del a
del b
惨剧发生: 虽然我们 del 了 a 和 b,但 a 引用着 b,b 也引用着 a。它们的计数永远停留在 1,无法归零。
这些对象成了内存中的"僵尸",它们不再能被业务代码访问,却死死霸占着内存空间。
💡总结:对象何时死亡?
在 Python 的世界里,一个对象的寿命取决于它对外界是否还有"利用价值" (即引用数)。
- 如果你处理的是海量短生命周期对象(如在循环里不断创建临时列表),引用计数会非常勤快地帮你清理现场。
- 如果你发现内存一直在涨,却找不到泄露点,那大概率是掉进了循环引用的陷阱。