[Python] struct.unpack() 用法详解

struct.unpack()用法详解

文章目录


struct.unpack() 是 Python 中用于将二进制数据(字节序列)解析为 Python 数据类型的函数,通常与 struct.pack() 配对使用。它根据指定的格式字符串(format string)解析字节流,并返回一个包含解析结果的元组。


一、函数语法

python 复制代码
struct.unpack(format, buffer)
  • format:格式字符串,定义数据的解析规则(字节顺序、数据类型、数量等)。
  • buffer :包含二进制数据的缓冲区(如 bytesbytearray 或支持缓冲协议的对象)。

返回值:包含解析后数据的元组。


二、格式字符串详解

格式字符串由两部分组成:

  1. 字节顺序/对齐字符(可选):

    字符 含义 大小端
    @ 本地顺序(默认) 系统依赖
    = 本地标准大小 系统依赖
    < 小端(Little-Endian) 低位在前
    > 大端(Big-Endian) 高位在前
    ! 网络顺序(大端) RFC 标准
  2. 数据类型字符(必选):

    字符 C 类型 Python 类型 字节数
    x 填充字节 跳过字节 1
    c char bytes (长度1) 1
    b signed char int 1
    B unsigned char int 1
    ? _Bool bool 1
    h short int 2
    H unsigned short int 2
    i int int 4
    I unsigned int int 4
    l long int 4
    L unsigned long int 4
    q long long int 8
    Q unsigned long long int 8
    f float float 4
    d double float 8
    s char[] bytes 长度见下文
    p Pascal 字符串 bytes 1+长度
    P void* int 系统依赖

    特殊用法

    • s:需指定长度,如 10s 表示解析 10 字节的字符串。
    • 数字前缀:3I 表示连续解析 3 个无符号整数。

三、使用示例

示例 1:解析整数和浮点数
python 复制代码
import struct

# 二进制数据:小端顺序 (<) + int (i) + float (f)
buffer = b'\x01\x00\x00\x00\xcd\xcc\x8c@'
data = struct.unpack('<if', buffer)  # 解析1个int和1个float

print(data)  # 输出: (1, 7.000000476837158)
示例 2:解析字符串
python 复制代码
# 数据:大端 (>) + 4字节字符串 (4s)
buffer = b'ABCD'
data = struct.unpack('>4s', buffer)

print(data)  # 输出: (b'ABCD',)
示例 3:解析混合类型
python 复制代码
# 数据:小端 (<) + short (h) + 3字节字符串 (3s) + float (f)
buffer = b'\x01\x00XYZ\x00\x00\x80?'
data = struct.unpack('<h3sf', buffer)

print(data)  # 输出: (1, b'XYZ', 1.0)
示例 4:跳过填充字节
python 复制代码
# 格式: 小端 (<) + char (c) + 填充1字节 (x) + int (i)
buffer = b'A\x00\x02\x00\x00\x00'
data = struct.unpack('<cx i', buffer)

print(data)  # 输出: (b'A', 2)
示例 5:解析数组
python 复制代码
# 解析3个连续的 unsigned short (H)
buffer = b'\x01\x00\x02\x00\x03\x00'
data = struct.unpack('<3H', buffer)

print(data)  # 输出: (1, 2, 3)

四、关键注意事项

  1. 缓冲区长度必须匹配

    使用 struct.calcsize(format) 验证格式字符串所需的字节数:

    python 复制代码
    fmt = '<2i f'
    buffer = b'\x00' * struct.calcsize(fmt)  # 创建匹配长度的缓冲区
  2. 字节顺序至关重要

    大端/小端错误会导致解析数值异常:

    python 复制代码
    # 错误示例:大端数据用小端解析
    buffer = b'\x00\x00\x00\x01'  # 大端表示的整数 1
    struct.unpack('<I', buffer)   # 错误!解析为 16777216 (0x01000000)
  3. 字符串处理
    s 类型返回 bytes 对象,需用 .decode() 转为字符串:

    python 复制代码
    data = struct.unpack('5s', b'Hello')[0]
    print(data.decode('utf-8'))  # 输出: 'Hello'
  4. 内存对齐问题

    默认格式 @ 会按本地对齐方式插入填充字节。使用 = 或标准顺序(</>)避免对齐。


五、常见错误

  • struct.error: unpack requires a buffer of X bytes
    缓冲区长度与格式字符串不匹配。
  • 解析指针类型 (P)
    结果依赖平台(32/64位),通常应避免使用。

通过合理设计格式字符串,struct.unpack() 可高效处理二进制协议(如网络数据、文件格式)。


研究学习不易,点赞易。
工作生活不易,收藏易,点收藏不迷茫 :)


相关推荐
weixin_47233946几秒前
使用Python提取PDF元数据的完整指南
java·python·pdf
QQ6765800835 分钟前
基于 PyTorch 的 VGG16 深度学习人脸识别检测系统的实现+ui界面
人工智能·pytorch·python·深度学习·ui·人脸识别
木木黄木木35 分钟前
Python制作史莱姆桌面宠物!可爱的
开发语言·python·宠物
exploration-earth1 小时前
本地优先的状态管理与工具选型策略
开发语言·前端·javascript
胖哥真不错1 小时前
Python基于方差-协方差方法实现投资组合风险管理的VaR与ES模型项目实战
python·毕业设计·课程设计·方差-协方差方法·投资组合风险管理·var与es模型
慧一居士1 小时前
flask功能使用总结和完整示例
python
苦学编程的谢2 小时前
Java网络编程API 1
java·开发语言·网络
大模型铲屎官2 小时前
【深度学习-Day 23】框架实战:模型训练与评估核心环节详解 (MNIST实战)
人工智能·pytorch·python·深度学习·大模型·llm·mnist
寒山李白2 小时前
Java 依赖注入、控制反转与面向切面:面试深度解析
java·开发语言·面试·依赖注入·控制反转·面向切面
梓仁沐白2 小时前
【Kotlin】数字&字符串&数组&集合
android·开发语言·kotlin