Python教学:十六进制编码的显示方法-由Deepseek产生

下面给出使用 Python 以十六进制形式显示字符串编码(字节序列)的多种方法。


方法1:使用 bytes.hex() (最简单)

python 复制代码
def show_hex(text: str, encoding='utf-8'):
    """将字符串编码后以十六进制形式显示"""
    encoded = text.encode(encoding)
    hex_str = encoded.hex()                     # 连续十六进制字符串
    spaced = ' '.join(encoded.hex()[i:i+2] for i in range(0, len(encoded.hex()), 2))  # 空格分隔
    print(f"原始字符串: {text}")
    print(f"编码方式: {encoding}")
    print(f"字节序列: {encoded}")
    print(f"十六进制(连续): {hex_str}")
    print(f"十六进制(分隔): {spaced}")

# 测试
show_hex("Hello 中国", 'utf-8')

输出示例

复制代码
原始字符串: Hello 中国
编码方式: utf-8
字节序列: b'Hello \xe4\xb8\xad\xe5\x9b\xbd'
十六进制(连续): 48656c6c6f20e4b8ade59bbd
十六进制(分隔): 48 65 6c 6c 6f 20 e4 b8 ad e5 9b bd

方法2:使用 binascii.hexlify

python 复制代码
import binascii

def show_hex_binascii(text: str, encoding='utf-8'):
    encoded = text.encode(encoding)
    hex_bytes = binascii.hexlify(encoded)       # 返回字节对象 b'48656c6c...'
    hex_str = hex_bytes.decode('ascii')         # 转为字符串
    print(f"十六进制: {hex_str}")

show_hex_binascii("Python 3.9", 'gbk')

方法3:手动格式化每个字节

python 复制代码
def show_hex_manual(text: str, encoding='utf-8'):
    encoded = text.encode(encoding)
    hex_parts = [f"{b:02x}" for b in encoded]   # 每个字节转两位十六进制
    print(" ".join(hex_parts))

show_hex_manual("αβγ", 'utf-8')
# 输出: ce b1 ce b2 ce b3  (希腊字母的 UTF-8 编码)

方法4:显示所有支持的编码并对比

python 复制代码
text = "A€"   # 欧元符号
encodings = ['utf-8', 'utf-16', 'gbk', 'latin-1']

for enc in encodings:
    try:
        encoded = text.encode(enc)
        print(f"{enc:8} -> {encoded.hex()}")
    except UnicodeEncodeError:
        print(f"{enc:8} -> 编码错误")

输出示例

复制代码
utf-8    -> 41e282ac
utf-16   -> fffe4100ac20
gbk      -> 4180
latin-1  -> 编码错误   (因为 € 不在 Latin-1 范围内)

完整实用函数(带详细注释)

python 复制代码
def hex_dump_string(s: str, encoding: str = 'utf-8', sep: str = ' ') -> str:
    """
    返回字符串编码后的十六进制表示(每个字节两位,可选分隔符)。
    
    参数:
        s: 原始字符串
        encoding: 编码名称,例如 'utf-8', 'gbk', 'utf-16'
        sep: 分隔符,默认空格,使用 '' 表示无分隔符
    
    返回:
        十六进制字符串
    """
    encoded = s.encode(encoding)
    if sep:
        return sep.join(f"{b:02x}" for b in encoded)
    else:
        return encoded.hex()

# 示例
print(hex_dump_string("Hello 世界", 'utf-8'))          # 48 65 6c 6c 6f 20 e4 b8 96 e7 95 8c
print(hex_dump_string("Hello 世界", 'utf-8', ''))      # 48656c6c6f20e4b896e7958c
print(hex_dump_string("Hello 世界", 'utf-16-be'))      # 00 48 00 65 00 6c 00 6c 00 6f 00 20 4e 16 75 4c

注意事项

  1. 字符串本身不是字节 :Python 字符串是 Unicode 代码点序列,必须通过 .encode() 方法转换为特定编码的字节序列后才能看到"十六进制"。
  2. 不同编码结果不同:同一字符串使用 UTF-8、UTF-16、GBK 等编码会得到完全不同的字节序列。
  3. 显示格式:通常用空格分隔每个字节的十六进制值,便于阅读;连续十六进制串常用于数据存储或哈希计算。

以上方法可以根据需求选择,最简单且推荐的是 str.encode().hex()

相关推荐
兵慌码乱7 小时前
面向桌面端的资产管理系统分层架构设计与核心模块实现
python·系统架构·sqlite·pyqt5·数据库设计·桌面应用开发·mvc架构
hboot9 小时前
AI工程师第三课 - 机器学习基础
python·scikit-learn·kaggle
To_OC12 小时前
LC 1 两数之和:面试第一道必考题,暴力解法直接被面试官 pass
javascript·算法·leetcode
顾林海14 小时前
Agent入门阶段-编程基础-Python:流程控制
python·agent·ai编程
鱼鱼不愚与16 小时前
《原来如此 | 第01期:为什么导航软件能预测红绿灯倒计时?》
算法
呱呱复呱呱16 小时前
Django CBV 源码解读:一个请求是怎么找到你的 get() 方法的
python·django
复杂网络21 小时前
论最小 Agent 计算机的形态
算法
曲幽21 小时前
刚部署的 LibreTranslate 频频翻车?我掏出了 20 年前的 StarDict 词典,用 FastAPI 搭了个本地词典翻译 API
python·fastapi·web·translate·goldendict·libretranslate·stardict·pystardict
荣码21 小时前
用Streamlit给AI应用套个界面,10行代码出Web页面
java·python