Python 操作 读/写 Excel

Python 操作 读/写 Excel

准备知识

文件格式

什么是 xls
格式类型 XLS 是 Excel 97-2003 使用的文件格式,基于二进制文件格式
文件扩展名 .xls
兼容性 由于其历史悠久,XLS 文件格式在较旧版本的 Excel 中广泛使用。较新的 Excel 版本也能打开和编辑 XLS 文件
特性和限制 最大支持 65536 行和 256 列。 因为是二进制格式,文件较大,处理速度较慢。 支持的功能和特性相对较少,不支持一些新功能。
什么是 xlsx
格式类型 XLSX 是 Excel 2007 及之后版本使用的文件格式,基于 Office Open XML 标准(XML 文件格式)。
文件扩展名 .xlsx
兼容性 XLSX 是现代 Excel 版本默认使用的文件格式
特性和优势 最大支持 1048576 行和 16384 列 由于基于 XML,文件压缩更好,体积更小,处理速度更快。 支持更多新功能和特性,如更复杂的图表、条件格式、数据验证等。 更安全,支持更好的数据恢复机制
什么是 XLSM
格式类型 XLSM 是 Excel 2007 及之后版本使用的文件格式,基于 Office Open XML 标准(XML 文件格式)
文件扩展名 .xlsm
兼容性 XLSM 文件与现代版本的 Excel 兼容
特性和优势 支持宏 : XLSM 文件可以存储和执行 VBA 宏,适用于需要自动化任务的复杂工作簿。 结构和功能 : 与 XLSX 文件类似,XLSM 也基于 XML 格式,支持更大容量的数据存储(最大支持 1048576 行和 16384 列)和丰富的功能特性(如复杂图表、条件格式、数据验证等)。 安全性 : 由于宏可以执行代码,XLSM 文件可能带有安全风险。Excel 会在打开 XLSM 文件时提示用户启用或禁用宏,以防止潜在的恶意代码执行。
使用场景 自动化任务 :在 Excel 中自动化重复性任务,如数据处理、报表生成等。 复杂工作簿:包含大量数据和复杂功能的工作簿,特别是需要宏来提高效率的场景。
注意事项 安全风险 :由于宏可以包含恶意代码,打开不明来源的 XLSM 文件时要谨慎,确保文件来自可信来源。 启用宏:Excel 默认会禁用宏,需要手动启用以运行宏功能。

术语

工作表工作薄

工作表

工作表: xlsx 文件

openpyxl

openpyxl 是一个用于读取和写入 Excel 2010 xlsx/xlsm/xltx/xltm 文件的 Python 库。它支持 Excel 文件的创建、修改和数据提取,并能处理复杂的电子表格操作,如公式、图表和格式设置。openpyxl 以其易用性和强大功能广受欢迎,适用于数据分析、自动化报表生成等任务。

安装

bash 复制代码
pip install openpyxl

Example 1 - 创建表格

将以下数据写入工作表

要求如下:

工作表名 example1.xlsx

工作薄名 大数据1班

学号 姓名 性别 年龄
21001 张三 18
21002 李四 20

代码实现

py 复制代码
from openpyxl import Workbook

# 创建工作表
work_book = Workbook()

# print(work_book.sheetnames)
# ['Sheet']

# 一个工作表至少有一个工作簿. 你可以通过 Workbook.active 来获取
work_sheet = work_book.active

# 修改工作薄的名字
work_sheet.title = "大数据1班"

# 将数据写入单元格
work_sheet.cell(row=1, column=1, value="学号")
work_sheet.cell(row=1, column=2, value="姓名")
work_sheet.cell(row=1, column=3, value="性别")
work_sheet.cell(row=1, column=4, value="年龄")

work_sheet.cell(row=2, column=1, value="21001")
work_sheet.cell(row=2, column=2, value="张三")
work_sheet.cell(row=2, column=3, value="男")
work_sheet.cell(row=2, column=4, value=18)

work_sheet.cell(row=3, column=1, value="21002")
work_sheet.cell(row=3, column=2, value="李四")
work_sheet.cell(row=3, column=3, value="女")
work_sheet.cell(row=3, column=4, value=20)

# 保存工作表
work_book.save("./example1.xlsx")

Example 2 - 读取表格数据

python 复制代码
from openpyxl.reader.excel import load_workbook

operate_file = "./files/example1.xlsx"
new_operate_file = "./files/example2.xlsx"
# 打开工作表
work_book = load_workbook(operate_file)

# print(work_book.sheetnames)
# ['大数据1班']

# 获取工作薄
work_sheet = work_book["大数据1班"]

# 获取单元格数据
# 比如获取 第二行, 第四列 的数据
d = work_sheet.cell(row=2, column=4)
print(d.value)

# 修改单元格数据
work_sheet.cell(row=2, column=4, value=28)

# 假如修改了单元格的数据, 应该保存到文件

# 保存方式1:  保存到原文件
# work_book.save(operate_file)

# 保存方式2:  保存到新文件
work_book.save(new_operate_file)
相关推荐
沙滩小绵羊14 分钟前
Linux常见命令
linux·运维·服务器
小智RE0-走在路上38 分钟前
Python学习笔记(11) --数据可视化
笔记·python·学习
历程里程碑41 分钟前
hot 206
java·开发语言·数据结构·c++·python·算法·排序算法
Coder_Boy_1 小时前
Java+Proteus仿真Arduino控制LED问题排查全记录(含交互过程)
java·人工智能·python
qq_356196951 小时前
day47_预训练模型与迁移学习@浙大疏锦行
python
Tipriest_1 小时前
C++ 的 ranges 和 Python 的 bisect 在二分查找中的应用与实现
c++·python·算法·二分法
老歌老听老掉牙1 小时前
符号计算中的表达式等价性验证:数学等价性与计算简化策略分析
python·数学建模·sympy
誰能久伴不乏1 小时前
epoll 学习踩坑:`fcntl` 设置非阻塞到底用 `F_SETFL` 还是 `F_SETFD`?
linux·服务器·网络·c++·tcp/ip
scan7241 小时前
向量数据库检索
python
摸鱼仙人~2 小时前
一文详解PyTorch DDP
人工智能·pytorch·python