Python 内存手术刀:sys.getrefcount 与引用计数的生死时速

前言:你是否有了解过python 最核心、最基础的内存管理机制------引用计数(Reference Counting)


1. 监控台:sys.getrefcount 的数字游戏

在 Python 中,每一个对象创建时,都会自带一个名为 ob_refcnt 的属性。这个数字记录了当前有多少个变量(指针)正指向这个对象。

我们通过 sys.getrefcount() 这个"监控摄像头"来观察它的生死时速:

Python

css 复制代码
import sys

# 1. 创建一个对象
a = [1, 2, 3]
print(sys.getrefcount(a)) 

实验发现: 你可能以为输出是 1,但实际输出通常是 2

知识点: sys.getrefcount(a) 在执行时,会将变量 a 作为参数传递给函数。在函数内部,形参也引用了该对象,导致计数临时 +1。所以,实际计数永远比你肉眼看到的变量数多 1。


2. 计数的"时速":谁在拨动数字?

对象的引用计数就像一个不停波动的计数器,以下四种行为是导致计数增加的"四大元凶":

① 赋值操作

Python

ini 复制代码
a = [1, 2, 3]  # 计数从 0 变 1 (加上临时引用共 2)
b = a          # 计数再 +1

② 传参

Python

scss 复制代码
def check(data):
    print(sys.getrefcount(data)) # 进入函数,形参引用,计数再 +1

check(a)

③ 放入容器

Python

ini 复制代码
my_list = [a, a, 123] # a 被两次放入列表,计数 +2

④ 属性绑定

Python

ini 复制代码
class MyObj: pass
obj = MyObj()
obj.attr = a  # 作为对象的属性,计数 +1

3. 计数的"刹车":触发归零的瞬间

当引用计数变为 0 的那一刻,Python 会毫不留情地立即回收该对象占用的内存。这就是对象"死亡"的瞬间。

触发计数减少的操作通常包括:

  • 使用 del 显式删除del a 并不是删除对象,而是删除了"指向对象的标签",让计数 -1。
  • 变量被重新赋值a = 456,原先 [1, 2, 3] 的计数 -1。
  • 对象离开作用域:这是最常见的场景。当一个函数执行结束,函数内部的所有局部变量会被销毁,它们指向的对象的计数集体 -1。

4. 深度对比:为什么 Python 是"实时回收"?

这是 Python 内存管理最迷人的地方,也是它与 Java、Go 等语言最大的区别。

Python 的"即刻处决"

引用计数机制最大的优点是实时性。一旦计数归零,内存立即释放。

  • 优点:内存回收的开销平摊在每一次赋值和销毁中,逻辑简单且极其高效。
  • 副作用:你需要频繁地维护这个计数器,这在多线程环境下会带来严重的性能锁竞争(这也是 GIL 存在的理由之一)。

Java 的"等待宣判" (STW)

Java 的垃圾回收主要依赖可达性分析。它不会在引用断开的一瞬间回收内存,而是等到内存压力大到一定程度时,启动 GC 线程。

  • STW (Stop The World) :在 Java 进行大规模垃圾回收时,整个应用程序可能会短暂"暂停",等待清洁工打扫完毕。
  • 对比:Python 就像是一个每个乘客下车都立刻打扫座位的出租车;而 Java 更像是一辆运行了一整天、回到终点站才统一大扫除的公交车。

5. 引用计数的"死穴":循环引用

引用计数虽然高效,但它有一个致命的逻辑漏洞:它不识"连环计"

Python

css 复制代码
# 构造一个互相伤害的死循环
a = {}
b = {}
a['next'] = b
b['next'] = a

del a
del b

惨剧发生: 虽然我们 delab,但 a 引用着 bb 也引用着 a。它们的计数永远停留在 1,无法归零。

这些对象成了内存中的"僵尸",它们不再能被业务代码访问,却死死霸占着内存空间。


💡总结:对象何时死亡?

在 Python 的世界里,一个对象的寿命取决于它对外界是否还有"利用价值" (即引用数)。

  1. 如果你处理的是海量短生命周期对象(如在循环里不断创建临时列表),引用计数会非常勤快地帮你清理现场。
  2. 如果你发现内存一直在涨,却找不到泄露点,那大概率是掉进了循环引用的陷阱。
相关推荐
明月_清风2 小时前
Python 消失的内存:为什么 list=[] 是新手最容易踩的“毒苹果”?
后端·python
IT_陈寒15 小时前
Python开发者必知的5大性能陷阱:90%的人都踩过的坑!
前端·人工智能·后端
流浪克拉玛依16 小时前
Go Web 服务限流器实战:从原理到压测验证 --使用 Gin 框架 + Uber Ratelimit / 官方限流器,并通过 Vegeta 进行性能剖析
后端
Flittly16 小时前
【从零手写 ClaudeCode:learn-claude-code 项目实战笔记】(3)TodoWrite (待办写入)
python·agent
孟沐16 小时前
保姆级教程:手写三层架构 vs MyBatis-Plus
后端
星浩AI16 小时前
让模型自己写 Skills——从素材到自动生成工作流
人工智能·后端·agent
华仔啊19 小时前
为啥不用 MP 的 saveOrUpdateBatch?MySQL 一条 SQL 批量增改才是最优解
java·后端
武子康19 小时前
大数据-242 离线数仓 - DataX 实战:MySQL 全量/增量导入 HDFS + Hive 分区(离线数仓 ODS
大数据·后端·apache hive
砍材农夫20 小时前
TCP和UDP区别
后端