Python:序列化

在Python中,序列化是指将对象的状态转换为可以存储或传输的形式的过程。反序列化则是将这些形式的数据恢复成原始对象的过程。Python提供了多种序列化和反序列化的工具,其中最常用的是 picklejson 模块。

1. pickle 模块

pickle 模块可以将几乎任何Python对象转换为字节流(序列化),也可以将字节流恢复为原来的对象(反序列化)。pickle 主要用于Python内部对象的序列化。

序列化(Dumping)
python 复制代码
import pickle

# 定义一个对象
data = {
    'name': 'Alice',
    'age': 30,
    'is_student': False
}

# 序列化对象到文件
with open('data.pickle', 'wb') as file:
    pickle.dump(data, file)

# 序列化对象到字符串
data_str = pickle.dumps(data)
print(data_str)
反序列化(Loading)
python 复制代码
import pickle

# 从文件中反序列化对象
with open('data.pickle', 'rb') as file:
    loaded_data = pickle.load(file)
print(loaded_data)

# 从字符串中反序列化对象
loaded_data_str = pickle.loads(data_str)
print(loaded_data_str)

2. json 模块

json 模块用于处理JSON数据。JSON是一种轻量级的数据交换格式,广泛用于网络数据传输。json 模块可以将Python对象转换为JSON格式的字符串,也可以将JSON格式的字符串转换回Python对象。

序列化(Dumping)
python 复制代码
import json

# 定义一个对象
data = {
    'name': 'Alice',
    'age': 30,
    'is_student': False
}

# 序列化对象到文件
with open('data.json', 'w') as file:
    json.dump(data, file)

# 序列化对象到字符串
data_str = json.dumps(data)
print(data_str)
反序列化(Loading)
python 复制代码
import json

# 从文件中反序列化对象
with open('data.json', 'r') as file:
    loaded_data = json.load(file)
print(loaded_data)

# 从字符串中反序列化对象
loaded_data_str = json.loads(data_str)
print(loaded_data_str)

对比

  • pickle

    • 支持更复杂的Python对象,如自定义类实例。
    • 序列化后的数据是二进制格式,不适合在网络上传输。
    • 不安全,反序列化不受信任的数据可能导致安全问题。
  • json

    • 支持的数据类型较为有限,主要支持基本的Python数据类型(如字典、列表、字符串、数字、布尔值、None)。
    • 序列化后的数据是文本格式,适合在网络上传输。
    • 相对安全,因为JSON格式的数据不容易被恶意利用。

其他序列化模块

除了 picklejson,Python还有一些其他的序列化模块,如 yamlxml,适用于特定的场景。

yaml 模块

yaml 模块可以处理YAML格式的数据。YAML是一种人类可读的数据序列化语言,常用于配置文件。

python 复制代码
import yaml

# 定义一个对象
data = {
    'name': 'Alice',
    'age': 30,
    'is_student': False
}

# 序列化对象到字符串
data_str = yaml.dump(data)
print(data_str)

# 反序列化对象
loaded_data = yaml.safe_load(data_str)
print(loaded_data)
xml.etree.ElementTree 模块

xml.etree.ElementTree 模块可以处理XML格式的数据。XML是一种标记语言,常用于结构化数据的存储和传输。

python 复制代码
import xml.etree.ElementTree as ET

# 创建一个XML元素
root = ET.Element('root')
ET.SubElement(root, 'name').text = 'Alice'
ET.SubElement(root, 'age').text = '30'
ET.SubElement(root, 'is_student').text = 'False'

# 序列化对象到字符串
data_str = ET.tostring(root, encoding='unicode')
print(data_str)

# 解析XML字符串
root = ET.fromstring(data_str)
name = root.find('name').text
age = int(root.find('age').text)
is_student = root.find('is_student').text == 'True'

print(name, age, is_student)

选择合适的序列化模块取决于具体需求,比如数据的复杂性、传输的格式和安全性要求等。

相关推荐
橡晟3 小时前
深度学习入门:让神经网络变得“深不可测“⚡(二)
人工智能·python·深度学习·机器学习·计算机视觉
墨尘游子3 小时前
神经网络的层与块
人工智能·python·深度学习·机器学习
倔强青铜33 小时前
苦练Python第18天:Python异常处理锦囊
开发语言·python
u_topian4 小时前
【个人笔记】Qt使用的一些易错问题
开发语言·笔记·qt
企鹅与蟒蛇4 小时前
Ubuntu-25.04 Wayland桌面环境安装Anaconda3之后无法启动anaconda-navigator问题解决
linux·运维·python·ubuntu·anaconda
autobaba4 小时前
编写bat文件自动打开chrome浏览器,并通过selenium抓取浏览器操作chrome
chrome·python·selenium·rpa
珊瑚里的鱼4 小时前
LeetCode 692题解 | 前K个高频单词
开发语言·c++·算法·leetcode·职场和发展·学习方法
AI+程序员在路上4 小时前
QTextCodec的功能及其在Qt5及Qt6中的演变
开发语言·c++·qt
xingshanchang4 小时前
Matlab的命令行窗口内容的记录-利用diary记录日志/保存命令窗口输出
开发语言·matlab
Risehuxyc4 小时前
C++卸载了会影响电脑正常使用吗?解析C++运行库的作用与卸载后果
开发语言·c++