Java 实战：高效合并多个 Word 文档

在企业开发和日常办公自动化中，我们经常需要处理 Word 文档。例如生成报告、合同、培训资料或批量文档时，往往会遇到需要将多个 Word 文件合并为一个的需求。手动操作不仅耗时，还容易出错，尤其是当文档数量较多或内容复杂时。通过 Java 程序化处理 Word 文档，可以大幅提升效率，同时保证合并后的文档排版一致、结构清晰。

本文将系统讲解在 Java 中合并 Word 文档的常用方法，提供完整示例，帮助你快速掌握文档合并技巧。

为什么需要合并 Word 文档

在实际工作中，Word 文档合并的需求主要包括：

生成综合报告: 多个部门或模块生成的 Word 文件，需要合并成一份总文档，便于统一存档或分发。
批量处理文档: 企业或自动化流程中，需要将大量 Word 文件合并，如果手动操作效率低且容易出错。
统一排版格式: 合并后的文档可统一页眉页脚、样式和章节格式，保证专业排版和可读性。

通过程序化合并 Word 文档，可以避免手动操作，提高效率，并保证多份文档格式一致。

环境准备

在开始编程之前，需要准备以下条件：

Java 开发环境（JDK 8 或以上）
Word 文档处理库 ：本文示例使用 Spire.Doc for Java，它提供了便捷的 API 来操作 Word 文档，包括加载、插入、克隆和保存等功能。

Maven 依赖示例：

java 复制代码

<repositories>
    <repository>
        <id>com.e-iceblue</id>
        <name>e-iceblue</name>
        <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.doc</artifactId>
        <version>14.1.3</version>
    </dependency>
</dependencies>

环境准备好后，即可开始合并 Word 文档。

示例一：直接插入整个文档

这种方式适用于快速合并文档。插入的文档会作为新的 Section 添加，与原文档独立。

实现步骤

创建 Document 对象并加载第一个 Word 文档。
调用 insertTextFromFile() 方法，将第二个文档整体插入第一个文档中。
保存合并后的文档为新文件。

示例代码

java 复制代码

import com.spire.doc.*;

public class MergeWord {
    public static void main(String[] args) {
        // 创建 Document 对象并加载第一个 Word 文档
        Document document = new Document("C:/Samples/Sample1.docx");

        // 将第二个 Word 文档整体插入
        document.insertTextFromFile("C:/Samples/Sample2.docx", FileFormat.Docx_2013);

        // 保存合并后的文档
        document.saveToFile("MergingResult.docx", FileFormat.Docx_2013);

        System.out.println("文档合并完成！");
    }
}

说明

insertTextFromFile() 会将第二个文档作为新的 Section 插入，因此原文档和插入文档的页眉页脚独立。
优点：操作简单，执行速度快。
适用场景：快速生成合并文档，不需要精细控制文档结构。

示例二：按文档结构逐项合并

在需要保留文档结构或章节连续性的情况下，可以逐项合并内容。新的文档内容会承接在第一个文档末尾，与原文档内容连续。

实现步骤

创建两个 Document 对象并分别加载两个 Word 文档。
遍历第二个文档的 Section 和 Body 子对象。
将每个 DocumentObject 深度克隆，并添加到第一个文档最后一个 Section 的 Body 中。
保存合并后的文档。

示例代码

java 复制代码

import com.spire.doc.*;

public class MergeDocuments {
    public static void main(String[] args) {
        // 加载两个 Word 文档
        Document document1 = new Document("C:/Samples/Sample1.docx");
        Document document2 = new Document("C:/Samples/Sample2.docx");

        // 遍历第二个文档的 Section
        for (Object sectionObj : (Iterable) document2.getSections()) {
            Section sec = (Section) sectionObj;

            // 遍历 Section 的 Body 对象
            for (Object docObj : (Iterable) sec.getBody().getChildObjects()) {
                DocumentObject obj = (DocumentObject) docObj;

                // 获取第一个文档的最后一个 Section
                Section lastSection = document1.getLastSection();
                Body body = lastSection.getBody();

                // 深度克隆对象并添加
                body.getChildObjects().add(obj.deepClone());
            }
        }

        // 保存合并后的文档
        document1.saveToFile("MergingResult.docx", FileFormat.Docx_2013);

        System.out.println("文档按结构合并完成！");
    }
}

说明

通过 深度克隆 DocumentObject，将第二个文档内容承接在第一个文档末尾，保证章节、段落和表格顺序连续。
优点：保持原文档结构，可在合并过程中进行修改或调整。
注意：页眉页脚可能需要手动调整，如果希望统一样式，可在合并前后设置。

示例三：批量合并多个 Word 文档

在实际项目中，通常需要合并多个文档，可以通过循环读取文件列表依次插入。

实现步骤

创建一个 Document 对象，并加载第一个 Word 文档作为基础文档。
通过循环遍历剩余文档列表，使用 insertTextFromFile() 方法依次插入。
保存最终合并的文档。

示例代码

java 复制代码

import com.spire.doc.*;
import java.util.Arrays;
import java.util.List;

public class MergeMultiple {
    public static void main(String[] args) {
        List<String> files = Arrays.asList(
            "C:/Samples/Sample1.docx",
            "C:/Samples/Sample2.docx",
            "C:/Samples/Sample3.docx"
        );

        Document resultDoc = new Document(files.get(0));

        for (int i = 1; i < files.size(); i++) {
            resultDoc.insertTextFromFile(files.get(i), FileFormat.Docx_2013);
        }

        resultDoc.saveToFile("MergedAll.docx", FileFormat.Docx_2013);
        System.out.println("批量合并完成！");
    }
}

说明

循环读取文件列表，实现批量合并。
默认每个文件作为新的 Section 插入，如果需要连续内容，可改用按结构克隆的方法。

注意事项

页眉页脚： 如果合并文档中页眉页脚不同，可能需要手动统一或在程序中设置。
样式和格式： 深度克隆可以保留段落、表格和样式，但在合并后建议检查文档以确保所有格式符合预期。
文件大小： 多个大文档合并时，生成文档文件可能较大，请注意内存占用。

总结

通过本文的示例，我们展示了在 Java 中合并 Word 文档的不同方法，包括将整个文档快速插入、按结构逐项合并，以及批量处理多个文档。这些方法可以根据实际需求灵活选择，无论是快速生成汇总报告，还是保持章节连续性、统一排版风格，都能够有效提升文档处理效率，减少手动操作的工作量，同时确保最终文档的专业性和可读性。