Python教学:十六进制编码的显示方法-由Deepseek产生

下面给出使用 Python 以十六进制形式显示字符串编码(字节序列)的多种方法。


方法1:使用 bytes.hex() (最简单)

python 复制代码
def show_hex(text: str, encoding='utf-8'):
    """将字符串编码后以十六进制形式显示"""
    encoded = text.encode(encoding)
    hex_str = encoded.hex()                     # 连续十六进制字符串
    spaced = ' '.join(encoded.hex()[i:i+2] for i in range(0, len(encoded.hex()), 2))  # 空格分隔
    print(f"原始字符串: {text}")
    print(f"编码方式: {encoding}")
    print(f"字节序列: {encoded}")
    print(f"十六进制(连续): {hex_str}")
    print(f"十六进制(分隔): {spaced}")

# 测试
show_hex("Hello 中国", 'utf-8')

输出示例

复制代码
原始字符串: Hello 中国
编码方式: utf-8
字节序列: b'Hello \xe4\xb8\xad\xe5\x9b\xbd'
十六进制(连续): 48656c6c6f20e4b8ade59bbd
十六进制(分隔): 48 65 6c 6c 6f 20 e4 b8 ad e5 9b bd

方法2:使用 binascii.hexlify

python 复制代码
import binascii

def show_hex_binascii(text: str, encoding='utf-8'):
    encoded = text.encode(encoding)
    hex_bytes = binascii.hexlify(encoded)       # 返回字节对象 b'48656c6c...'
    hex_str = hex_bytes.decode('ascii')         # 转为字符串
    print(f"十六进制: {hex_str}")

show_hex_binascii("Python 3.9", 'gbk')

方法3:手动格式化每个字节

python 复制代码
def show_hex_manual(text: str, encoding='utf-8'):
    encoded = text.encode(encoding)
    hex_parts = [f"{b:02x}" for b in encoded]   # 每个字节转两位十六进制
    print(" ".join(hex_parts))

show_hex_manual("αβγ", 'utf-8')
# 输出: ce b1 ce b2 ce b3  (希腊字母的 UTF-8 编码)

方法4:显示所有支持的编码并对比

python 复制代码
text = "A€"   # 欧元符号
encodings = ['utf-8', 'utf-16', 'gbk', 'latin-1']

for enc in encodings:
    try:
        encoded = text.encode(enc)
        print(f"{enc:8} -> {encoded.hex()}")
    except UnicodeEncodeError:
        print(f"{enc:8} -> 编码错误")

输出示例

复制代码
utf-8    -> 41e282ac
utf-16   -> fffe4100ac20
gbk      -> 4180
latin-1  -> 编码错误   (因为 € 不在 Latin-1 范围内)

完整实用函数(带详细注释)

python 复制代码
def hex_dump_string(s: str, encoding: str = 'utf-8', sep: str = ' ') -> str:
    """
    返回字符串编码后的十六进制表示(每个字节两位,可选分隔符)。
    
    参数:
        s: 原始字符串
        encoding: 编码名称,例如 'utf-8', 'gbk', 'utf-16'
        sep: 分隔符,默认空格,使用 '' 表示无分隔符
    
    返回:
        十六进制字符串
    """
    encoded = s.encode(encoding)
    if sep:
        return sep.join(f"{b:02x}" for b in encoded)
    else:
        return encoded.hex()

# 示例
print(hex_dump_string("Hello 世界", 'utf-8'))          # 48 65 6c 6c 6f 20 e4 b8 96 e7 95 8c
print(hex_dump_string("Hello 世界", 'utf-8', ''))      # 48656c6c6f20e4b896e7958c
print(hex_dump_string("Hello 世界", 'utf-16-be'))      # 00 48 00 65 00 6c 00 6c 00 6f 00 20 4e 16 75 4c

注意事项

  1. 字符串本身不是字节 :Python 字符串是 Unicode 代码点序列,必须通过 .encode() 方法转换为特定编码的字节序列后才能看到"十六进制"。
  2. 不同编码结果不同:同一字符串使用 UTF-8、UTF-16、GBK 等编码会得到完全不同的字节序列。
  3. 显示格式:通常用空格分隔每个字节的十六进制值,便于阅读;连续十六进制串常用于数据存储或哈希计算。

以上方法可以根据需求选择,最简单且推荐的是 str.encode().hex()

相关推荐
biter down1 小时前
8:YAML 语法
运维·python
05候补工程师1 小时前
【408数据结构】核心考点:图(Graph)精炼笔记与算法直觉
数据结构·经验分享·笔记·考研·算法·图论
并不喜欢吃鱼1 小时前
从零开始 C++------ 十四【C++ 数据结构】unordered_map/unordered_set 全解析:从使用到底层模拟实现
开发语言·数据结构·c++
靠沿1 小时前
【动态规划算法】专题三——简单多状态dp问题
算法·动态规划
知识分享小能手1 小时前
数据预处理入门学习教程,从入门到精通,数据获取 — 知识点详解与案例代码(4)
python·学习·pandas
曾几何时`1 小时前
Go(一)Gin框架 和 GORM机制
开发语言·golang·gin
吃好睡好便好1 小时前
矩阵秩的计算
人工智能·学习·线性代数·算法·机器学习·matlab·矩阵
计算机安禾1 小时前
【算法分析与设计】第35篇:后缀数据结构:后缀树与后缀数组的构造
大数据·人工智能·算法·机器学习·剪枝
计算机安禾1 小时前
【算法分析与设计】第38篇:最近点对与分治在几何中的应用
java·服务器·网络·数据库·算法