本文主要讲Word与Excel格式的文件
Word 格式与 Python 函数库
Python 操作 Word 格式的库是 python-docx 库 安装与导入方法
pip install python-docx
...
import docx
Excel 格式与 Python 函数库
- xlsx 格式⼀般采⽤ openpyxl 进⾏读写
- 如果是 xls 格式,对 Word ⽂件读取时采⽤ xlrd 库,写⼊则需要使⽤ xlwt 库
批量处理
-
Excel 批量合并
通过遍历取得将要合并的所有 Excel ⽂件
files = [x for x in p.iterdir() if PurePath(x).match('*.xlsx')]
Excel 批量拆分
- 批量拆分的关键是遍历所有的单元格
和遍历元组⼀样,可以采⽤ for...in 的结构遍历单元格
实现数据的批量格式转换
- 将 Word ⽂件转换为 Excel ⽂件 步骤:
- 遍历word文件中的"段落"
- 获取段落内存并保存到列表中
- 打开Excel 文件将列表中的每个元素写入到单位格中 4.关闭文件
- 将 Excel ⽂件转换为 Word ⽂件 Excel ⽂件有多张表,也⽐ Word ⽂件的宽度更宽,因此要提前确定转换前后的格式