Python StringIO 和 BytesIO 用法

在 Python 中,我们平时处理的输入输出(I/O)大多数是针对文件或网络数据的,但有时候,我们希望直接在内存中进行读写 ,而不必先把数据存到硬盘上。

这时候,StringIOBytesIO 就派上用场了。

参考文章:Python StringIO 和 BytesIO | 简单一点学习 easyeasy.me

简单理解:

  • StringIO → 操作内存中的 字符串str 类型)
  • BytesIO → 操作内存中的 二进制数据bytes 类型)

它们都来自 io 模块,接口和文件对象几乎一模一样,所以学会文件操作就能直接用它们。


1. 为什么要用 StringIO / BytesIO

  • 无需磁盘 I/O,速度快
  • 便于测试(不需要真实文件)
  • 在网络编程中常用(比如 HTTP 响应先存在内存中再处理)
  • 数据临时存储(比如生成报告、图片)

2. StringIO 基础用法

StringIO 适合处理 文本数据,使用方式类似普通文件:

python 复制代码
from io import StringIO

# 创建 StringIO 对象
f = StringIO()

# 写入数据
f.write("Hello ")
f.write("Python")

# 获取当前内容
print(f.getvalue())  # Hello Python

注意:getvalue() 用来获取缓冲区的全部数据。


3. StringIO 读取数据

我们也可以直接用 StringIO 来模拟读取文件:

python 复制代码
from io import StringIO

data = "Line1\nLine2\nLine3"
f = StringIO(data)

# 一次性读取
print(f.read())

# 重置游标
f.seek(0)

# 按行读取
for line in f:
    print(line.strip())

要点:

  • seek(0) → 把"文件指针"移动到开头
  • 读取方法(readreadlinereadlines)和文件对象一致

4. BytesIO 基础用法

BytesIO 用于处理 二进制数据,比如图片、音频、压缩包等。

python 复制代码
from io import BytesIO

# 创建 BytesIO
f = BytesIO()

# 写入二进制数据
f.write(b"Hello World")

# 获取数据
print(f.getvalue())  # b'Hello World'

5. BytesIO 读取数据

python 复制代码
from io import BytesIO

data = b"Binary\x00Data"
f = BytesIO(data)

# 读取前6个字节
print(f.read(6))  # b'Binary'

# 继续读剩下的
print(f.read())   # b'\x00Data'

6. StringIO vs BytesIO 区别

特性 StringIO BytesIO
处理数据类型 str(文本) bytes(二进制)
读取写入方式 和文本文件一致 和二进制文件一致
编码解码 不需要手动编码 需要自己 .encode() / .decode()
常见应用 日志处理、临时文本 图片、音频、网络传输数据

7. 从文件到内存的转换

有时我们需要把磁盘文件内容读到内存中用 BytesIO 处理,比如处理图片:

python 复制代码
from io import BytesIO

# 假设有个图片
with open("test.png", "rb") as f:
    data = f.read()

# 存入 BytesIO
bio = BytesIO(data)

# 读取前10个字节
print(bio.read(10))

8. 从内存保存到文件

反过来,我们也可以把 BytesIOStringIO 的数据写到磁盘:

python 复制代码
from io import BytesIO

# 创建内存数据
bio = BytesIO()
bio.write(b"Save me to file")

# 写入文件
with open("output.bin", "wb") as f:
    f.write(bio.getvalue())

9. 常见使用场景

  1. 临时构建数据,避免磁盘 I/O
  2. 测试代码时,模拟文件对象
  3. 网络数据处理(HTTP 请求、Socket 传输)
  4. 图片或音频处理(配合 Pillow、pydub 等库)

10. 最佳实践

  • 如果处理的是文本,用 StringIO,并且直接写 str 类型。
  • 如果处理的是二进制数据(比如图片、压缩包),用 BytesIO,并且确保写入的是 bytes
  • 操作完成后不一定非要 close()(因为它们是内存对象),但为了习惯最好加上。
  • 需要频繁读取时,记得用 seek(0) 重置指针。
相关推荐
期待のcode9 小时前
MyBatisX插件
java·数据库·后端·mybatis·springboot
yaoh.wang11 小时前
力扣(LeetCode) 13: 罗马数字转整数 - 解法思路
python·程序人生·算法·leetcode·面试·职场和发展·跳槽
华仔啊12 小时前
这 10 个 MySQL 高级用法,让你的代码又快又好看
后端·mysql
小鸡吃米…12 小时前
Python PyQt6教程七-控件
数据库·python
码事漫谈12 小时前
国产时序数据库崛起:金仓凭什么在复杂场景中碾压InfluxDB
后端
上进小菜猪13 小时前
当时序数据不再“只是时间”:金仓数据库如何在复杂场景中拉开与 InfluxDB 的差距
后端
1916zz13 小时前
Extreme programing 方利喆 _ 江贤晟
python
长安牧笛13 小时前
智能鞋柜—脚气终结者,内置温湿度传感器和紫外线灯,晚上回家,把鞋放进去,自动检测湿度,湿度超标就启动烘干+紫外线杀菌,第二天穿鞋干燥无异味。
python
weixin_4577600013 小时前
PIL库将图片位深度是1、8、32统一转换为24的方法
python
盖世英雄酱5813613 小时前
springboot 项目 从jdk 8 升级到jdk21 会面临哪些问题
java·后端