Python+docx实现python对word文档的编辑

前言:

该模块可以通过python代码来对word文档进行大批量的编辑。docx它提供了一组功能丰富的函数和方法,用于创建、修改和读取Word文档。下面是docx模块中一些常用的函数和方法的介绍:

安装:pip install docx

一、准备一个word文档,文档内容大致如下

二、读取文档中的内容

1、读取段落内容

通过遍历 doc.paragraphs 来获取文档中的每个段落的文本内容。

python 复制代码
from docx import Document

path = 'test.docx'         #word文档路径
doc  = Document(path)   #创建一个文档对象

#遍历文档中的所有段落
for par in doc.paragraphs:
    text = par.text
    print(text)

输出的结果如下:

2、读取表格内容

python 复制代码
from docx import Document

path = 'test.docx'         #word文档路径
doc  = Document(path)   #创建一个文档对象


# 遍历文档中的表格
for table in doc.tables:
    for row in table.rows:
        for cell in row.cells:
            text = cell.text
            print(text)

输出的结果如下:

需要开发工具来实现word 或 Excel 批量编辑的欢迎给我留言

[+]可以代开发可视化操作界面;

[+]高度贴合用户需求和使用场景;

[+]一次投入,永久受益,实现高效快速办公,永久解放双手

三、修改

修改内容需要注意,需要配合**document.save(file_path):将文档保存到指定的文件路径file_path。**

1、修改文档内容: 比如把文档中的 "所有的123" 替换成 "好好学习"

python 复制代码
from docx import Document

path = 'test.docx'         #word文档路径
doc  = Document(path)   #创建一个文档对象
# 遍历文档中的所有段落
for par in doc.paragraphs:
    text = par.text
    if '123' in par.text:
        par.text = par.text.replace('123','好好学习!')
#凡是有保存功能的,需要先把原文档关闭才可以编辑
doc.save(path)  #注意这里如果使用的原文档的路径,则会直接对原文档的内容进行修改,
new_path = 'new_test.docx'    #创建一个新路径
doc.save(new_path)          #这里则会把内容保存到一个新文档中

输出结果:

因为我这里保存了两个路径:

1、可以看到这里新生成了一个word文档

2、查看两个文档中的内容

原文档:

新生成文档:

总结:

1、思路:

先定位修改的内容------>然后赋值------>保存(没有修改的内容都会原样保存下来)

2、运行修改的功能时候需要把原文档关闭;

3、如果不生成新的文档则切记,修改内容不可逆!!!

2、修改表格内容: 把表格中的 "休息" 替换成 "预习"

这里可以多复制几张表格

按照上面的思路来:

1、先定位,找到修改目标的坐标

python 复制代码
from docx import Document

path = 'test.docx'         #word文档路径
doc  = Document(path)   #创建一个文档对象
tables = doc.tables
#获取表格中所有内容对应的坐标
for i, row in enumerate(tables[0].rows):
    for j, cell in enumerate(row.cells):
        print( f'[+]{cell.text}    [+]对应的坐标是   ({i}, {j})\n')

输出结果:

这里注意(这里找坐标和我们平时看表的习惯不一样,他们并没有逻辑上的关系,而只是单纯的坐标来对应)

2、记住这个坐标我们后面就可以对所有的表进行修改:

注意下面代码中的 cell(2,1) 中的坐标就是上面我们找到的坐标,通过tables[tab]是逐一遍历出每一张表格,然后把对应的坐标文档替换为 '预习'.

python 复制代码
from docx import Document

path = 'test.docx'         #word文档路径
doc  = Document(path)   #创建一个文档对象
tables = doc.tables         #这里已经把文档中的所有表格都取出来了,以列表的形式存储
#获取表格中所有内容对应的坐标
for tab in range(len(tables)):
        tables[tab].cell(2,1).text='预习'
# #凡是有保存功能的,需要先把原文档关闭才可以编辑
doc.save(path)  #注意这里如果使用的原文档的路径,则会直接对原文档的内容进行修改,

输出结果:

相关推荐
小可的科研日常6 小时前
保持Word中插入图片的清晰度
word
小码ssim13 小时前
通过POI实现对word基于书签的内容替换、删除、插入
java·word
一把年纪学编程1 天前
【牛马技巧】word统计每一段的字数接近“字数统计”
前端·数据库·word
爱吃零食的白糖1 天前
word换行符和段落标记
word
Etincelle2 天前
【LaTeX】Word插入LaTeX行间公式如何编号和对齐
word·wps·latex
老马啸西风2 天前
sensitive-word-admin v2.0.0 全新 ui 版本发布!vue+前后端分离
vue.js·ui·ai·nlp·github·word
wqqqianqian3 天前
国产linux系统(银河麒麟,统信uos)使用 PageOffice 在线打开Word文件,并用前端对话框实现填空填表
linux·前端·word·pageoffice
诸葛大钢铁3 天前
在线caj转换word
word
LAM LAB3 天前
【WPS】怎么解决“word的复制表格”粘贴到“excel的单元格”变多行单元格的问题
word·excel·wps
winfredzhang4 天前
使用Python 打造多格式文件预览工具 — 图、PDF、Word、Excel 一站式查看
python·pdf·word·excel·照片·查看,zip,复制