Word与Excel对应的Python 函数库

本文主要讲Word与Excel格式的文件

Word 格式与 Python 函数库

Python 操作 Word 格式的库是 python-docx 库 安装与导入方法

复制代码
pip install python-docx
...
import docx

Excel 格式与 Python 函数库

  • xlsx 格式⼀般采⽤ openpyxl 进⾏读写
  • 如果是 xls 格式,对 Word ⽂件读取时采⽤ xlrd 库,写⼊则需要使⽤ xlwt 库

批量处理

  • Excel 批量合并

    通过遍历取得将要合并的所有 Excel ⽂件

    files = [x for x in p.iterdir() if PurePath(x).match('*.xlsx')]

Excel 批量拆分

  • 批量拆分的关键是遍历所有的单元格

和遍历元组⼀样,可以采⽤ for...in 的结构遍历单元格

实现数据的批量格式转换

  • 将 Word ⽂件转换为 Excel ⽂件 步骤:
  1. 遍历word文件中的"段落"
  2. 获取段落内存并保存到列表中
  3. 打开Excel 文件将列表中的每个元素写入到单位格中 4.关闭文件
  • 将 Excel ⽂件转换为 Word ⽂件 Excel ⽂件有多张表,也⽐ Word ⽂件的宽度更宽,因此要提前确定转换前后的格式
相关推荐
ponponon1 小时前
时代的眼泪,nameko 和 eventlet 停止维护后的项目自救,升级和替代之路
python
Flittly1 小时前
【从零手写 ClaudeCode:learn-claude-code 项目实战笔记】(5)Skills (技能加载)
python·agent
敏编程1 小时前
一天一个Python库:pyarrow - 大规模数据处理的利器
python
Flittly3 小时前
【从零手写 ClaudeCode:learn-claude-code 项目实战笔记】(4)Subagents (子智能体)
python·agent
明月_清风10 小时前
Python 装饰器前传:如果不懂“闭包”,你只是在复刻代码
后端·python
明月_清风10 小时前
打破“死亡环联”:深挖 Python 分代回收与垃圾回收(GC)机制
后端·python
ZhengEnCi1 天前
08c. 检索算法与策略-混合检索
后端·python·算法
明月_清风1 天前
Python 内存手术刀:sys.getrefcount 与引用计数的生死时速
后端·python
明月_清风1 天前
Python 消失的内存:为什么 list=[] 是新手最容易踩的“毒苹果”?
后端·python
Flittly2 天前
【从零手写 ClaudeCode:learn-claude-code 项目实战笔记】(3)TodoWrite (待办写入)
python·agent