引入:
在pymysql中,查询函数fetchall()返回值是一个元组,为什么要以元组形式返回呢?
- 元组**「不可变」**,保护查询数据不被篡改
2. 元组性能更高,适配大数据量查询
- 语义匹配:数据库行是「固定结构数据」
针对2,为什么元组开销比列表小且性能更高?
这是一个非常棒的深入提问!元组(tuple)的开销比列表(list)小,根源只有一个:元组是不可变类型,列表是可变类型。
列表要随时修改、扩容,所以内存里必须存:
- 数据本身
- 当前元素个数 (
len()用) - 已分配的总容量(预留空位,防止频繁扩容)
- 指向数据区的指针
- 扩容相关的标记位
元组长度固定、不能修改,所以内存里只存:
- 数据本身
- 固定的长度(创建时就定死,不用变)
接下来再从底层数据结构的实现来分析这个问题:
列表底层的 3 个核心实现细节
1. 连续内存存储(和元组一样)
列表的所有元素在内存里是紧挨着存放的,这是数组的本质:
- 优点:随机访问超快 (通过索引
list[i]取值,时间复杂度 O (1)) - 这也是数据库
fetchall用「数组结构(元组)」的原因:遍历、索引查询速度拉满
2. 存的是「对象指针」,不是数据本身
Python 是动态语言,列表能存任意类型(数字、字符串、对象、甚至另一个列表),底层原理是:列表只存指向真实数据的内存地址(指针),不直接存数据。
3. 关键:预分配内存 + 动态扩容(列表开销大的根源)
这是列表和元组最大的区别,也是列表开销更高的核心:
- 元组:创建时只分配刚好存数据的内存
- 列表:解释器会提前多分配一部分空闲内存 (预分配),为了应对
append()、extend()增删操作
列表每次扩容需要4个步骤:
- 申请新内存 :解释器找一块更大的连续内存
- 复制数据 :把旧内存里的所有数据原封不动拷贝到新内存
- 添加新元素 :把新元素
5放进新内存的空位 - 丢弃旧内存 :释放原来的小内存(还给系统),列表直接指向新的大内存
总结:
- 列表底层是动态数组 :需要预分配内存、维护容量 / 长度,所以开销大
- 元组底层是静态数组 :无预分配、无扩容,结构精简,所以开销小
- 数据库 fetchall 返回元组:查询数据只读、不需要修改,用静态数组(元组)速度更快、更省内存,完美适配大数据查询场景