使用python 将多个docx文件合并为一个word

先安装python环境

接着安装依赖 ,采用docxcompose 依赖包 进行合并word,执行如下命令进行安装

python 复制代码
pip install docxcompose
python 复制代码
from docxcompose.composer import Composer
from docx import Document
import os

def merge_with_docxcompose(doc_list, output_path):
    master = Document(doc_list[0])
    composer = Composer(master)
    
    for doc_path in doc_list[1:]:
        doc = Document(doc_path)
        composer.append(doc)
    
    composer.save(output_path)
	
	
# 定义包含所有需要合并的Word文档路径的列表
documents_to_merge = []
document_dir = './file3'
# 检查目录是否存在
if not os.path.exists(document_dir):
    raise FileNotFoundError(f"目录 {document_dir} 不存在")

# 获取所有.docx文件
for file in sorted(os.listdir(document_dir)):

    if file.endswith('.docx'):
        full_path = os.path.join(document_dir, file)
        documents_to_merge.append(full_path)

if not documents_to_merge:
    raise ValueError("没有找到任何.docx文件进行合并")

output_file = 'merged_document5.docx'
# merge_documents(documents_to_merge, output_file)
merge_with_docxcompose(documents_to_merge, output_file)
print(f"文档已成功合并到 {output_file}")

代码说明: document_dir 是 要合并的文件目录 ;output_file 是合成后的文件 。

依赖包对比: 使用 python-docx 进行合并时, 图片无法合并到新文档中, 使用docxcompose 图片可合并到新文档中。

如果还无法解决实际需求 可考虑

  1. 先将每个文档转为 PDF(使用 python-docx2pdf

  2. 合并 PDF(使用 PyPDF2

  3. 再将合并后的 PDF 转回 Word(如果需要)

相关推荐
小清兔25 分钟前
c#基础知识
开发语言·数据库·学习·unity·c#·游戏引擎·.net
刘恒12345678932 分钟前
Pycharm
ide·python·pycharm
奇某人2 小时前
【语法】【C+V】本身常用图表类型用法快查【CSDN不支持,VSCODE可用】
开发语言·vscode·markdown·mermaid
做一位快乐的码农2 小时前
php程序设计之基于PHP的手工艺品销售网站/基于php在线销售系统/基于php在线购物商城系统
开发语言·php
@珍惜一生@3 小时前
Qt开源库
开发语言·qt·开源
Slaughter信仰3 小时前
深入理解Java虚拟机:JVM高级特性与最佳实践(第3版)第四章知识点问答补充及重新排版
java·开发语言·jvm
心灵宝贝3 小时前
Mac用户安装JDK 22完整流程(Intel版dmg文件安装指南附安装包下载)
java·开发语言·macos
今***b3 小时前
Python 操作 PPT 文件:从新手到高手的实战指南
java·python·powerpoint
secondyoung3 小时前
一文丝滑使用Markdown:从写作、绘图到转换为Word与PPT
开发语言·vscode·编辑器·powerpoint·markdown·visual studio·mermaid
程序员杰哥4 小时前
Jmeter+Jenkins接口压力测试持续集成
自动化测试·软件测试·python·测试工具·jmeter·jenkins·压力测试