Java 利用 Apache POI 实现多模板 Word 文档生成(补充:模板文档为复杂表单的处理办法)

当 Word 模板文档的内容是复杂表单时,处理方式会比普通文字更复杂一些,但依旧可以借助 Apache POI 库来完成。以下是详细的处理思路和示例代码:

处理思路

  1. 识别表单元素:复杂表单里可能包含表格、文本框、下拉框等元素。你需要对这些元素进行识别,并且明确要替换内容的位置。
  2. 替换表格内容:对于表格,要定位到具体的单元格,然后对单元格内的内容进行替换。
  3. 处理文本框:文本框也是需要特别处理的元素,要遍历文档中的文本框并替换其中的内容。
  4. 动态赋值:和处理普通文字一样,利用占位符来进行动态赋值。

示例代码

scss 复制代码
import org.apache.poi.xwpf.usermodel.*;
import org.openxmlformats.schemas.wordprocessingml.x2006.main.CTBody;

import java.io.*;
import java.util.HashMap;
import java.util.Map;

public class ComplexFormDocGenerator {

    public static void main(String[] args) {
        String[] templatePaths = {"complex_template.docx"};
        String outputPath = "complex_output.docx";
        Map<String, String> values = new HashMap<>();
        values.put("${name}", "李四");
        values.put("${department}", "技术部");

        try {
            generateDocument(templatePaths, outputPath, values);
            System.out.println("文档生成成功,路径为: " + outputPath);
        } catch (IOException e) {
            System.err.println("生成文档时出现错误: " + e.getMessage());
            e.printStackTrace();
        }
    }

    public static void generateDocument(String[] templatePaths, String outputPath, Map<String, String> values) throws IOException {
        XWPFDocument finalDocument = new XWPFDocument();

        for (String templatePath : templatePaths) {
            try (FileInputStream templateStream = new FileInputStream(templatePath);
                 XWPFDocument templateDocument = new XWPFDocument(templateStream)) {

                replacePlaceholders(templateDocument, values);
                appendDocument(finalDocument, templateDocument);
            }
        }

        try (FileOutputStream outputStream = new FileOutputStream(outputPath)) {
            finalDocument.write(outputStream);
        }
    }

    private static void replacePlaceholders(XWPFDocument document, Map<String, String> values) {
        // 处理段落中的占位符
        for (XWPFParagraph paragraph : document.getParagraphs()) {
            for (XWPFRun run : paragraph.getRuns()) {
                String text = run.getText(0);
                if (text != null) {
                    for (Map.Entry<String, String> entry : values.entrySet()) {
                        text = text.replace(entry.getKey(), entry.getValue());
                    }
                    run.setText(text, 0);
                }
            }
        }

        // 处理表格中的占位符
        for (XWPFTable table : document.getTables()) {
            for (XWPFTableRow row : table.getRows()) {
                for (XWPFTableCell cell : row.getTableCells()) {
                    for (XWPFParagraph paragraph : cell.getParagraphs()) {
                        for (XWPFRun run : paragraph.getRuns()) {
                            String text = run.getText(0);
                            if (text != null) {
                                for (Map.Entry<String, String> entry : values.entrySet()) {
                                    text = text.replace(entry.getKey(), entry.getValue());
                                }
                                run.setText(text, 0);
                            }
                        }
                    }
                }
            }
        }

        // 处理文本框中的占位符(POI 对文本框处理有限,可结合其他库)
        // 这里仅简单示例,实际可能需要更复杂逻辑
        // 可以使用 docx4j 等库来更好地处理文本框
        for (IBodyElement element : document.getBodyElements()) {
            if (element instanceof XWPFSDT) {
                XWPFSDT sdt = (XWPFSDT) element;
                for (XWPFParagraph paragraph : sdt.getContent().getParagraphs()) {
                    for (XWPFRun run : paragraph.getRuns()) {
                        String text = run.getText(0);
                        if (text != null) {
                            for (Map.Entry<String, String> entry : values.entrySet()) {
                                text = text.replace(entry.getKey(), entry.getValue());
                            }
                            run.setText(text, 0);
                        }
                    }
                }
            }
        }
    }

    private static void appendDocument(XWPFDocument mainDocument, XWPFDocument appendDocument) throws IOException {
        CTBody mainBody = mainDocument.getDocument().getBody();
        CTBody appendBody = appendDocument.getDocument().getBody();

        for (Object object : appendBody.getContent()) {
            mainBody.addNewP().set(object);
        }
    }
}

代码解释

  1. ​main​ 方法 :和处理普通文字的示例类似,定义了模板文件路径、输出文件路径以及动态赋值的内容,然后调用 ​generateDocument​ 方法生成文档。
  2. ​generateDocument​ 方法:循环读取每个模板文件,对其进行动态赋值,再将内容追加到最终文档里,最后把最终文档写入输出文件。
  3. ​replacePlaceholders​ 方法
  • 处理段落:和普通文字处理一样,遍历文档中的段落和运行对象,把占位符替换成实际的值。
  • 处理表格:遍历文档中的所有表格,再遍历表格的行和单元格,对单元格内的段落和运行对象进行占位符替换。
  • 处理文本框 :使用 ​XWPFSDT​ 来识别文本框,遍历文本框内的段落和运行对象,进行占位符替换。不过 Apache POI 对文本框的处理能力有限,实际应用中可能需要结合 ​docx4j​ 等其他库。
  1. ​appendDocument​ 方法:将一个文档的内容追加到另一个文档中。

注意事项

  • 要保证 ​complex_template.docx​ 文件存在于项目的根目录下,或者根据实际情况修改文件路径。
  • 运行代码前,要确保项目中已经正确引入了 Apache POI 的依赖。
  • 对于复杂的表单元素,如下拉框、复选框等,可能需要更复杂的处理逻辑,你可以结合 ​docx4j​ 等库来实现。
相关推荐
William一直在路上11 分钟前
SpringBoot 拦截器和过滤器的区别
hive·spring boot·后端
小马爱打代码1 小时前
Spring Boot 3.4 :@Fallback 注解 - 让微服务容错更简单
spring boot·后端·微服务
曾曜2 小时前
PostgreSQL逻辑复制的原理和实践
后端
豌豆花下猫2 小时前
Python 潮流周刊#110:JIT 编译器两年回顾,AI 智能体工具大爆发(摘要)
后端·python·ai
轻语呢喃2 小时前
JavaScript :事件循环机制的深度解析
javascript·后端
ezl1fe2 小时前
RAG 每日一技(四):让AI读懂你的话,初探RAG的“灵魂”——Embedding
后端
经典19922 小时前
spring boot 详解以及原理
java·spring boot·后端
Aurora_NeAr2 小时前
Apache Iceberg数据湖高级特性及性能调优
大数据·后端
程序员清风2 小时前
程序员要在你能挣钱的时候拼命存钱!
后端·面试·程序员
夜阳朔3 小时前
Conda环境激活失效问题
人工智能·后端·python