python IO编程：序列化

在Python的IO编程中，序列化（Serialization）是指将数据结构或对象转换为一种格式（如JSON、XML、二进制等），以便可以将其保存到磁盘、通过网络传输或存储在内存中。反序列化（Deserialization）则是将这种格式转换回原始的数据结构或对象。

Python提供了多种序列化方法，其中最常见的是使用pickle模块进行二进制序列化，以及使用json模块进行JSON格式的序列化。

使用`pickle`进行序列化

pickle模块可以将Python对象序列化为字节流，并且可以从字节流中反序列化回Python对象。

示例：使用`pickle`

复制代码

python复制代码

|---|----------------------------------------|
| | import pickle |
| | |
| | # 定义一个简单的数据结构 |
| | data = { |
| | 'name': 'Alice', |
| | 'age': 30, |
| | 'is_student': False, |
| | 'courses': ['Math', 'Science'] |
| | } |
| | |
| | # 序列化数据为字节流 |
| | with open('data.pkl', 'wb') as file: |
| | pickle.dump(data, file) |
| | |
| | # 从字节流中反序列化数据 |
| | with open('data.pkl', 'rb') as file: |
| | loaded_data = pickle.load(file) |
| | |
| | print(loaded_data) |

使用`json`进行序列化

json模块可以将Python数据结构（主要是字典和列表）序列化为JSON格式的字符串，并且可以从JSON字符串中反序列化回Python数据结构。

示例：使用`json`

复制代码

python复制代码

|---|------------------------------------------------------------|
| | import json |
| | |
| | # 定义一个简单的数据结构 |
| | data = { |
| | 'name': 'Alice', |
| | 'age': 30, |
| | 'is_student': False, |
| | 'courses': ['Math', 'Science'] |
| | } |
| | |
| | # 序列化数据为JSON格式的字符串 |
| | json_data = json.dumps(data, indent=4) # indent=4 用于美化输出 |
| | print(json_data) |
| | |
| | # 将JSON格式的字符串写入文件 |
| | with open('data.json', 'w') as file: |
| | file.write(json_data) |
| | |
| | # 从文件中读取JSON格式的字符串并反序列化 |
| | with open('data.json', 'r') as file: |
| | loaded_data = json.loads(file.read()) |
| | |
| | print(loaded_data) |

注意

安全性 ：pickle模块可以序列化几乎所有的Python对象，但这也意味着它可能执行不安全的代码，特别是当反序列化不可信的数据时。因此，在处理不可信的数据源时，应避免使用pickle，而使用更安全的序列化格式，如JSON。
兼容性：JSON是一种轻量级的数据交换格式，易于人阅读和编写，同时也易于机器解析和生成。它基于JavaScript的一个子集，但是JSON是独立于语言的，并且很多编程语言都支持JSON格式。这使得JSON成为一种非常流行的跨平台数据交换格式。
性能：pickle通常比json更快，并且能够序列化更复杂的数据结构。然而，对于需要在不同编程语言之间交换数据的场景，JSON通常是更好的选择。
文件操作 ：在序列化数据时，应始终使用with语句来打开文件，以确保文件在操作完成后正确关闭。

python IO编程：序列化

使用pickle进行序列化

示例：使用pickle

使用json进行序列化

示例：使用json

注意

使用`pickle`进行序列化

示例：使用`pickle`

使用`json`进行序列化

示例：使用`json`