使用python 将多个docx文件合并为一个word

先安装python环境

接着安装依赖 ,采用docxcompose 依赖包 进行合并word,执行如下命令进行安装

python 复制代码
pip install docxcompose
python 复制代码
from docxcompose.composer import Composer
from docx import Document
import os

def merge_with_docxcompose(doc_list, output_path):
    master = Document(doc_list[0])
    composer = Composer(master)
    
    for doc_path in doc_list[1:]:
        doc = Document(doc_path)
        composer.append(doc)
    
    composer.save(output_path)
	
	
# 定义包含所有需要合并的Word文档路径的列表
documents_to_merge = []
document_dir = './file3'
# 检查目录是否存在
if not os.path.exists(document_dir):
    raise FileNotFoundError(f"目录 {document_dir} 不存在")

# 获取所有.docx文件
for file in sorted(os.listdir(document_dir)):

    if file.endswith('.docx'):
        full_path = os.path.join(document_dir, file)
        documents_to_merge.append(full_path)

if not documents_to_merge:
    raise ValueError("没有找到任何.docx文件进行合并")

output_file = 'merged_document5.docx'
# merge_documents(documents_to_merge, output_file)
merge_with_docxcompose(documents_to_merge, output_file)
print(f"文档已成功合并到 {output_file}")

代码说明: document_dir 是 要合并的文件目录 ;output_file 是合成后的文件 。

依赖包对比: 使用 python-docx 进行合并时, 图片无法合并到新文档中, 使用docxcompose 图片可合并到新文档中。

如果还无法解决实际需求 可考虑

  1. 先将每个文档转为 PDF(使用 python-docx2pdf

  2. 合并 PDF(使用 PyPDF2

  3. 再将合并后的 PDF 转回 Word(如果需要)

相关推荐
yaoh.wang1 天前
力扣(LeetCode) 13: 罗马数字转整数 - 解法思路
python·程序人生·算法·leetcode·面试·职场和发展·跳槽
醇氧1 天前
【Windows】优雅启动:解析一个 Java 服务的后台启动脚本
java·开发语言·windows
小鸡吃米…1 天前
Python PyQt6教程七-控件
数据库·python
MapGIS技术支持1 天前
MapGIS Objects Java计算一个三维点到平面的距离
java·开发语言·平面·制图·mapgis
程序员zgh1 天前
C++ 互斥锁、读写锁、原子操作、条件变量
c语言·开发语言·jvm·c++
1916zz1 天前
Extreme programing 方利喆 _ 江贤晟
python
长安牧笛1 天前
智能鞋柜—脚气终结者,内置温湿度传感器和紫外线灯,晚上回家,把鞋放进去,自动检测湿度,湿度超标就启动烘干+紫外线杀菌,第二天穿鞋干燥无异味。
python
小灰灰搞电子1 天前
Qt 重写QRadioButton实现动态radioButton源码分享
开发语言·qt·命令模式
weixin_457760001 天前
PIL库将图片位深度是1、8、32统一转换为24的方法
python
by__csdn1 天前
Vue3 setup()函数终极攻略:从入门到精通
开发语言·前端·javascript·vue.js·性能优化·typescript·ecmascript