使用 Java 更新 Word 文档中的图表数据-超详细

使用 Java 更新 Word 文档中的图表数据

在日常的工作中,尤其是在数据分析和报告自动化的场景中,可能会遇到需要定期更新 Word 文档中的图表数据的需求。比如,生成数据报告时,我们需要在图表中更新一些动态的数据值。今天,我将展示如何使用 Java 和 Apache POI 库来实现这一功能:自动读取 Word 文件中的图表,提取 Excel 数据源,修改数据并更新图表。

背景

我们要处理的是 Word 文档中的图表,而这些图表的数据源存储在嵌入的 Excel 文件中。通过操作 Excel 数据,我们可以更新图表中的数据,并且确保图表会根据新的数据重新渲染。

本篇文章的目标是:

  • 读取 Word 文件中的图表。
  • 提取和修改图表的数据源(嵌入的 Excel 文件)。
  • 更新图表数据,并将修改后的数据嵌入回 Word 文件中。

依赖库

本项目使用了 Apache POI 作为核心库,它支持读取和操作 Word 文档(.docx 文件)和 Excel 文件(.xlsx 文件)。你需要在项目中添加以下依赖:

xml 复制代码
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>5.2.3</version>
</dependency>
<dependency>
    <groupId>org.apache.xmlbeans</groupId>
    <artifactId>xmlbeans</artifactId>
    <version>5.1.1</version>
</dependency>


// 或者 4.0版本

      <groupId>org.apache.poi</groupId>
      <artifactId>poi-ooxml</artifactId>
      <version>4.1.2</version>
    </dependency>
    <!-- https://mvnrepository.com/artifact/org.apache.poi/ooxml-schemas -->
    <dependency>
      <groupId>org.apache.poi</groupId>
      <artifactId>ooxml-schemas</artifactId>
      <version>1.4</version>
    </dependency>

    <dependency>
      <groupId>org.apache.poi</groupId>
      <artifactId>poi</artifactId>
      <version>4.1.2</version>
    </dependency>
    <!-- https://mvnrepository.com/artifact/org.apache.poi/poi-scratchpad -->
    <dependency>
      <groupId>org.apache.poi</groupId>
      <artifactId>poi-scratchpad</artifactId>
      <version>4.1.2</version>
    </dependency>
    <dependency>
      <groupId>org.apache.poi</groupId>
      <artifactId>poi-ooxml-schemas</artifactId>
      <version>4.1.2</version>
    </dependency>

步骤解析

  1. 读取 Word 文件

    使用 XWPFDocument 读取 Word 文件并获取其中的图表对象。每个图表都是一个 XWPFChart 对象,其中包含了图表的数据源,即嵌入的 Excel 文件。

  2. 提取 Excel 数据源

    从图表中提取嵌入的 Excel 数据源,并将其转化为 XSSFWorkbook 对象。这样我们可以访问 Excel 文件中的工作表,并对其数据进行修改。

  3. 修改 Excel 数据

    在修改 Excel 数据时,我们需要根据预设的规则来替换 Excel 单元格中的值。例如,在单元格中,某些值可能是动态的,需要替换为来自其他地方的数据。我们通过字符串查找和替换的方式来完成这一任务。

  4. 更新图表数据

    修改 Excel 数据后,我们需要将其更新回图表中。通过操作图表的底层 XML,我们可以更新图表的数据引用,并让图表基于新的数据重新绘制。

  5. 保存并覆盖原文件

    最后,我们将修改后的 Word 文件保存,并覆盖原有的文件,以便生成新的报告。

代码实现

以下是实现这个功能的 Java 代码:

java 复制代码
import org.apache.poi.xwpf.usermodel.*;
import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.apache.xmlbeans.XmlCursor;

import java.io.*;
import java.util.List;
import java.util.HashMap;
import java.util.Map;

public class WordChartUpdater {

    static Map<String,Object> cellValueMap = new HashMap<>();
    static Map<String, Object> tagDataMap = new HashMap<>();
    
    static {
        tagDataMap.put("current_branch_name","测试");
        tagDataMap.put("ZYJGZB_079","测试x");
        tagDataMap.put("ZYJGZB_091","11");
    }

    public static void updateChartInWord(File wordFile, ChartData chartData) throws IOException {
        // 1. 读取 Word 文件
        FileInputStream fis = new FileInputStream(wordFile);
        XWPFDocument document = new XWPFDocument(fis);

        // 2. 获取文档中的所有图表
        List<XWPFChart> charts = document.getCharts();
        if (charts.isEmpty()) {
            System.out.println("No charts found in the Word document.");
            return;
        }

        // 3. 获取图表的数据源
        for (XWPFChart chart : charts) {
            XSSFWorkbook workbook = getChartDataAsWorkbook(chart);
            if (workbook == null || workbook.getNumberOfSheets() == 0) {
                System.out.println("The chart does not have a valid data source.");
                continue;
            }

            // 4. 修改 Excel 数据
            modifyChartData(workbook, chartData);

            // 5. 将修改后的 Excel 数据嵌入到 Word 图表中
            updateChartWithNewData(chart, workbook);
        }

        // 6. 保存更新后的 Word 文件(覆盖原文件)
        FileOutputStream fos = new FileOutputStream(wordFile);
        document.write(fos);
        fos.close();
        fis.close();
    }

    private static XSSFWorkbook getChartDataAsWorkbook(XWPFChart chart) throws IOException {
        try {
            return chart.getWorkbook();
        } catch (InvalidFormatException e) {
            throw new IOException("Failed to extract workbook from chart", e);
        }
    }

    private static void modifyChartData(XSSFWorkbook workbook, ChartData chartData) {
        XSSFSheet sheetAt = workbook.getSheetAt(0);
        for (int i = 0; i < 20; i++) {  // 20列20行数据
            XSSFRow row = sheetAt.getRow(i);
            if (row == null) {
                break;
            }
            for (int j = 0; j < 20; j++) {
                XSSFCell cell = row.getCell(j);
                if (cell == null) {
                    break;
                }
                if (CellType.NUMERIC != cell.getCellType() && cell.getStringCellValue().contains("$")) {
                    String key = cell.getStringCellValue();
                    String substring = key.substring(key.lastIndexOf("$"), key.lastIndexOf("}") + 1);
                    if (tagDataMap.get(substring) != null) {
                        String s = key.replace(substring, (String) tagDataMap.get(substring));
                        cell.setCellValue(s);
                        cellValueMap.put(cell.getAddress().toString(), s);
                    } else {
                        cell.setCellValue(0);
                        cellValueMap.put(cell.getAddress().toString(), 0);
                    }
                }
            }
        }
    }

    private static void updateChartWithNewData(XWPFChart chart, XSSFWorkbook updatedWorkbook) throws IOException {
        // 图表数据更新的逻辑...
        // 评论或者私信即可领取
    }

    public static void main(String[] args) throws IOException {
        // 创建一个示例对象,填充数据
        ChartData chartData = new ChartData("value_079", "Branch A", "value_091");

        // 修改 Word 文件
        File wordFile = new File("D:\\Desktop\\GZRC_ceshi.docx");  // 修改为你的 Word 文件路径
        updateChartInWord(wordFile, chartData);
    }
}

代码详解

  • 读取 Word 文件 :首先,我们使用 XWPFDocument 从 Word 文件中读取数据。

  • 提取 Excel 数据源 :通过 getChartDataAsWorkbook 获取图表数据源,即嵌入在图表中的 Excel 文件。

  • 修改数据modifyChartData 方法根据需求修改 Excel 中的单元格数据,使用 tagDataMap 中的数据进行替换。

  • 更新图表 :在 updateChartWithNewData 方法中,我们将修改后的数据更新回图表。

  • 保存更新的 Word 文件 :最后,通过 document.write(fos) 将修改后的文件保存回磁盘。

总结

使用 Apache POI 处理 Word 文件中的图表更新是一项非常有用的技能,尤其是在自动化报告生成的过程中。通过对图表数据源(嵌入的 Excel 文件)进行修改,我们可以实现动态更新图表数据并更新 Word 文档,从而大大提高工作效率。

如果你有任何问题,或者遇到困难,欢迎在评论区留言。希望这篇文章能对你有所帮助!


相关推荐
风生u9 小时前
activiti7 详解
java
玄同7659 小时前
我的 Trae Skill 实践|使用 UV 工具一键搭建 Python 项目开发环境
开发语言·人工智能·python·langchain·uv·trae·vibe coding
岁岁种桃花儿9 小时前
SpringCloud从入门到上天:Nacos做微服务注册中心(二)
java·spring cloud·微服务
Word码9 小时前
[C++语法] 继承 (用法详解)
java·jvm·c++
Yorlen_Zhang9 小时前
Python Tkinter Text 控件完全指南:从基础编辑器到富文本应用
开发语言·python·c#
lxl13079 小时前
C++算法(1)双指针
开发语言·c++
TT哇9 小时前
【实习 】银行经理端两个核心功能的开发与修复(银行经理绑定逻辑修复和线下领取扫码功能开发)
java·vue.js
逝水如流年轻往返染尘9 小时前
Java中的数组
java
不绝1919 小时前
C#进阶:预处理指令/反射,Gettype,Typeof/关键类
开发语言·c#
无小道9 小时前
Qt-qrc机制简单介绍
开发语言·qt