python IO编程:序列化

在Python的IO编程中,序列化(Serialization)是指将数据结构或对象转换为一种格式(如JSON、XML、二进制等),以便可以将其保存到磁盘、通过网络传输或存储在内存中。反序列化(Deserialization)则是将这种格式转换回原始的数据结构或对象。

Python提供了多种序列化方法,其中最常见的是使用pickle模块进行二进制序列化,以及使用json模块进行JSON格式的序列化。

使用pickle进行序列化

pickle模块可以将Python对象序列化为字节流,并且可以从字节流中反序列化回Python对象。

示例:使用pickle
复制代码

python复制代码

|---|----------------------------------------|
| | import pickle |
| | |
| | # 定义一个简单的数据结构 |
| | data = { |
| | 'name': 'Alice', |
| | 'age': 30, |
| | 'is_student': False, |
| | 'courses': ['Math', 'Science'] |
| | } |
| | |
| | # 序列化数据为字节流 |
| | with open('data.pkl', 'wb') as file: |
| | pickle.dump(data, file) |
| | |
| | # 从字节流中反序列化数据 |
| | with open('data.pkl', 'rb') as file: |
| | loaded_data = pickle.load(file) |
| | |
| | print(loaded_data) |

使用json进行序列化

json模块可以将Python数据结构(主要是字典和列表)序列化为JSON格式的字符串,并且可以从JSON字符串中反序列化回Python数据结构。

示例:使用json
复制代码

python复制代码

|---|------------------------------------------------------------|
| | import json |
| | |
| | # 定义一个简单的数据结构 |
| | data = { |
| | 'name': 'Alice', |
| | 'age': 30, |
| | 'is_student': False, |
| | 'courses': ['Math', 'Science'] |
| | } |
| | |
| | # 序列化数据为JSON格式的字符串 |
| | json_data = json.dumps(data, indent=4) # indent=4 用于美化输出 |
| | print(json_data) |
| | |
| | # 将JSON格式的字符串写入文件 |
| | with open('data.json', 'w') as file: |
| | file.write(json_data) |
| | |
| | # 从文件中读取JSON格式的字符串并反序列化 |
| | with open('data.json', 'r') as file: |
| | loaded_data = json.loads(file.read()) |
| | |
| | print(loaded_data) |

注意

  1. 安全性pickle模块可以序列化几乎所有的Python对象,但这也意味着它可能执行不安全的代码,特别是当反序列化不可信的数据时。因此,在处理不可信的数据源时,应避免使用pickle,而使用更安全的序列化格式,如JSON。

  2. 兼容性:JSON是一种轻量级的数据交换格式,易于人阅读和编写,同时也易于机器解析和生成。它基于JavaScript的一个子集,但是JSON是独立于语言的,并且很多编程语言都支持JSON格式。这使得JSON成为一种非常流行的跨平台数据交换格式。

  3. 性能pickle通常比json更快,并且能够序列化更复杂的数据结构。然而,对于需要在不同编程语言之间交换数据的场景,JSON通常是更好的选择。

  4. 文件操作 :在序列化数据时,应始终使用with语句来打开文件,以确保文件在操作完成后正确关闭。

相关推荐
星火开发设计11 分钟前
模板参数:类型参数与非类型参数的区别
java·开发语言·前端·数据库·c++·算法
张3蜂15 分钟前
Python pip 命令完全指南:从入门到精通
人工智能·python·pip
忘梓.21 分钟前
二叉搜索树·极速分拣篇」:用C++怒肝《双截棍》分拣算法,暴打节点删除Boss战!
开发语言·c++·算法
星辰徐哥22 分钟前
Java数组的定义、操作与应用场景
java·开发语言
人工智能AI酱22 分钟前
【AI深究】高斯混合模型(GMM)全网最详细全流程详解与案例(附Python代码演示) | 混合模型概率密度函数、多元高斯分布概率密度函数、期望最大化(EM)算法 | 实际案例与流程 | 优、缺点分析
人工智能·python·算法·机器学习·分类·回归·聚类
Aileen_0v022 分钟前
【数据结构中链表常用的方法实现过程】
java·开发语言·数据结构·算法·链表·动态规划·csdn开发云
草莓熊Lotso29 分钟前
《算法闯关指南:优选算法--滑动窗口》--15.串联所有单词的子串,16.最小覆盖子串
开发语言·c++·人工智能·算法
Faker66363aaa42 分钟前
Faster-RCNN改进一基于R50-FPG的人脸与垃圾物体检测识别_crop640-50e_COCO
python
Andy Dennis1 小时前
一文认识Java常见集合
java·开发语言
kaizq1 小时前
Windows下基于Python构造Dify可视应用环境[非Dock]
windows·python·dify·大语言模型llm·人工智能ai·智能体agent