python读word中的表格和插入表格

读取word中的表格

有时候需要从word中读取表格数据。不同于excel,word中表格的对象属性是Table。

示例文档如下:

读取效果:

复制代码
行: 6 , 列: 3
['物料', '数量', '单价']
['车轮', '2', '100']
['坐垫', '1', '20']
['车把', '1', '5']
['车锁', '1', '13']
['总加', '138']

注意到表格最后一行有合并的单元格,目前的读取方法对于合并的单元格按照1个列单元读取!

代码:

复制代码
python 复制代码
import win32com.client as win32
from win32com.client import constants
import os

doc_app = win32.gencache.EnsureDispatch('Word.Application')#打开word应用程序
doc_app.Visible = True
curr_path = os.getcwd()
file_path = r'%s\带表格文档.docx'%curr_path
doc = doc_app.Documents.Open(file_path)

table = doc.Tables(1)
print('行:',table.Rows.Count, ', 列:', table.Columns.Count)
for row in table.Rows:#遍历表格每行
	info = []
	for cell in row.Cells:#遍历每行中的表格,即有效列
		info.append(cell.Range.Text[:-2])
	print(info)

读取word中带有合并单元格的表格

python 复制代码
print('有效单元格个数:',table.Range.Cells.Count)
for cell in table.Range.Cells:
	print(cell.RowIndex, ',', cell.ColumnIndex,',',cell.Range.Text[:-2])

word的对象中,无法直接判断单元格是否列合并或者行合并的。可以间接通过table.Cells来访问有效的单元格。如果访问cell.Row或者cell.Column,遇到合并的单元格会报错。

运行结果:

python 复制代码
有效单元格个数: 20
1 , 1 , 
1 , 2 , 物料
1 , 3 , 数量
1 , 4 , 单价
2 , 1 , 零件
2 , 2 , 车轮
2 , 3 , 2
2 , 4 , 100
3 , 2 , 坐垫
3 , 3 , 1
3 , 4 , 20
4 , 2 , 车把
4 , 3 , 1
4 , 4 , 5
5 , 2 , 车锁
5 , 3 , 1
5 , 4 , 13
6 , 1 , 
6 , 2 , 总加
6 , 3 , 138

在word中插入表格

脚本效果:

脚本实现的内容:在新的word文档中插入一个表格,并写入脚本的内容。

复制代码
python 复制代码
import win32com.client as win32
from win32com.client import constants
import os

doc_app = win32.gencache.EnsureDispatch('Word.Application')#打开word应用程序
doc = doc_app.Documents.Add()
doc_app.Visible = True

last_parag = doc.Paragraphs.Last
# 创建新的表格
table = doc.Tables.Add(Range=last_parag.Range, NumRows=3, NumColumns=4)
# 设置表格边框内外线
table.Borders.InsideLineStyle = constants.wdLineStyleSingle 
table.Borders.OutsideLineStyle = constants.wdLineStyleDouble 

#写入表格
cnt=0
for row in table.Rows:#遍历表格每行
	for cell in row.Cells:#遍历每行中的表格,即有效列
		cell.Range.Text = cnt
		cnt += 1 

插入第二个表格

复制代码
python 复制代码
#插入第二个表格
last_parag = doc.Paragraphs.Last
table2 = doc.Tables.Add(Range=last_parag.Range, NumRows=3, NumColumns=4)
table2.Borders.InsideLineStyle = constants.wdLineStyleSingle 
table2.Borders.OutsideLineStyle = constants.wdLineStyleDouble 

插入效果:

第二个表格插入效果,看起来和第一个连在一起了

调整一下,在第二个表格后面插入一个新的空行,拉开一段的距离。

复制代码
python 复制代码
#插入第二个表格
doc.Paragraphs.Add()# 插入新的一行
last_parag = doc.Paragraphs.Last #指向最后一行(刚插入的那一行)
table2 = doc.Tables.Add(Range=last_parag.Range, NumRows=3, NumColumns=4)
table2.Borders.InsideLineStyle = constants.wdLineStyleSingle 
table2.Borders.OutsideLineStyle = constants.wdLineStyleDouble 

遍历文档中的表格

python 复制代码
for table in doc.Tables:
    print(table.Row(1).Cells(1).Range.Text) # 打印每个表格中左上角单元格的内容
相关推荐
NiceCloud喜云1 小时前
Opus 4.8 的 Effort Control 怎么选:Low 到 Max 五档策略
android·java·大数据·前端·c++·python·spring
AI玫瑰助手2 小时前
Python函数:默认参数的定义与注意事项
开发语言·python·信息可视化
weixin_468466852 小时前
全局与局部注意力机制新手实战指南
人工智能·python·深度学习·算法·自然语言处理·transformer·注意力机制
油炸自行车2 小时前
Claude Code 错误:API Error: 400 Failed to deserialize the JSON body into the
开发语言·javascript·json·trae·claude code·api error 400
肩上风骋2 小时前
C++14特性
开发语言·c++·c++14特性
weixin_468466852 小时前
工业相机成像原理新手入门指南
人工智能·自动化·机器视觉·工业相机·光学·光学系统·成像原理
小糖学代码2 小时前
LLM系列:环境搭建:5.Python-dotenv 环境变量管理
人工智能·python·深度学习·神经网络
U盘失踪了2 小时前
claude code 用 Playwright + “webapp-testing” 技能包,编写前端自动化
自动化
智慧物业老杨3 小时前
智慧物业合同周期管理系统:从风险预警到智能交接的全流程数智化落地方案
java·人工智能·python
橙橙笔记3 小时前
Python的学习第一部分
python·学习