使用 Java 更新 Word 文档中的图表数据-超详细

使用 Java 更新 Word 文档中的图表数据

在日常的工作中,尤其是在数据分析和报告自动化的场景中,可能会遇到需要定期更新 Word 文档中的图表数据的需求。比如,生成数据报告时,我们需要在图表中更新一些动态的数据值。今天,我将展示如何使用 Java 和 Apache POI 库来实现这一功能:自动读取 Word 文件中的图表,提取 Excel 数据源,修改数据并更新图表。

背景

我们要处理的是 Word 文档中的图表,而这些图表的数据源存储在嵌入的 Excel 文件中。通过操作 Excel 数据,我们可以更新图表中的数据,并且确保图表会根据新的数据重新渲染。

本篇文章的目标是:

  • 读取 Word 文件中的图表。
  • 提取和修改图表的数据源(嵌入的 Excel 文件)。
  • 更新图表数据,并将修改后的数据嵌入回 Word 文件中。

依赖库

本项目使用了 Apache POI 作为核心库,它支持读取和操作 Word 文档(.docx 文件)和 Excel 文件(.xlsx 文件)。你需要在项目中添加以下依赖:

xml 复制代码
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>5.2.3</version>
</dependency>
<dependency>
    <groupId>org.apache.xmlbeans</groupId>
    <artifactId>xmlbeans</artifactId>
    <version>5.1.1</version>
</dependency>


// 或者 4.0版本

      <groupId>org.apache.poi</groupId>
      <artifactId>poi-ooxml</artifactId>
      <version>4.1.2</version>
    </dependency>
    <!-- https://mvnrepository.com/artifact/org.apache.poi/ooxml-schemas -->
    <dependency>
      <groupId>org.apache.poi</groupId>
      <artifactId>ooxml-schemas</artifactId>
      <version>1.4</version>
    </dependency>

    <dependency>
      <groupId>org.apache.poi</groupId>
      <artifactId>poi</artifactId>
      <version>4.1.2</version>
    </dependency>
    <!-- https://mvnrepository.com/artifact/org.apache.poi/poi-scratchpad -->
    <dependency>
      <groupId>org.apache.poi</groupId>
      <artifactId>poi-scratchpad</artifactId>
      <version>4.1.2</version>
    </dependency>
    <dependency>
      <groupId>org.apache.poi</groupId>
      <artifactId>poi-ooxml-schemas</artifactId>
      <version>4.1.2</version>
    </dependency>

步骤解析

  1. 读取 Word 文件

    使用 XWPFDocument 读取 Word 文件并获取其中的图表对象。每个图表都是一个 XWPFChart 对象,其中包含了图表的数据源,即嵌入的 Excel 文件。

  2. 提取 Excel 数据源

    从图表中提取嵌入的 Excel 数据源,并将其转化为 XSSFWorkbook 对象。这样我们可以访问 Excel 文件中的工作表,并对其数据进行修改。

  3. 修改 Excel 数据

    在修改 Excel 数据时,我们需要根据预设的规则来替换 Excel 单元格中的值。例如,在单元格中,某些值可能是动态的,需要替换为来自其他地方的数据。我们通过字符串查找和替换的方式来完成这一任务。

  4. 更新图表数据

    修改 Excel 数据后,我们需要将其更新回图表中。通过操作图表的底层 XML,我们可以更新图表的数据引用,并让图表基于新的数据重新绘制。

  5. 保存并覆盖原文件

    最后,我们将修改后的 Word 文件保存,并覆盖原有的文件,以便生成新的报告。

代码实现

以下是实现这个功能的 Java 代码:

java 复制代码
import org.apache.poi.xwpf.usermodel.*;
import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.apache.xmlbeans.XmlCursor;

import java.io.*;
import java.util.List;
import java.util.HashMap;
import java.util.Map;

public class WordChartUpdater {

    static Map<String,Object> cellValueMap = new HashMap<>();
    static Map<String, Object> tagDataMap = new HashMap<>();
    
    static {
        tagDataMap.put("current_branch_name","测试");
        tagDataMap.put("ZYJGZB_079","测试x");
        tagDataMap.put("ZYJGZB_091","11");
    }

    public static void updateChartInWord(File wordFile, ChartData chartData) throws IOException {
        // 1. 读取 Word 文件
        FileInputStream fis = new FileInputStream(wordFile);
        XWPFDocument document = new XWPFDocument(fis);

        // 2. 获取文档中的所有图表
        List<XWPFChart> charts = document.getCharts();
        if (charts.isEmpty()) {
            System.out.println("No charts found in the Word document.");
            return;
        }

        // 3. 获取图表的数据源
        for (XWPFChart chart : charts) {
            XSSFWorkbook workbook = getChartDataAsWorkbook(chart);
            if (workbook == null || workbook.getNumberOfSheets() == 0) {
                System.out.println("The chart does not have a valid data source.");
                continue;
            }

            // 4. 修改 Excel 数据
            modifyChartData(workbook, chartData);

            // 5. 将修改后的 Excel 数据嵌入到 Word 图表中
            updateChartWithNewData(chart, workbook);
        }

        // 6. 保存更新后的 Word 文件(覆盖原文件)
        FileOutputStream fos = new FileOutputStream(wordFile);
        document.write(fos);
        fos.close();
        fis.close();
    }

    private static XSSFWorkbook getChartDataAsWorkbook(XWPFChart chart) throws IOException {
        try {
            return chart.getWorkbook();
        } catch (InvalidFormatException e) {
            throw new IOException("Failed to extract workbook from chart", e);
        }
    }

    private static void modifyChartData(XSSFWorkbook workbook, ChartData chartData) {
        XSSFSheet sheetAt = workbook.getSheetAt(0);
        for (int i = 0; i < 20; i++) {  // 20列20行数据
            XSSFRow row = sheetAt.getRow(i);
            if (row == null) {
                break;
            }
            for (int j = 0; j < 20; j++) {
                XSSFCell cell = row.getCell(j);
                if (cell == null) {
                    break;
                }
                if (CellType.NUMERIC != cell.getCellType() && cell.getStringCellValue().contains("$")) {
                    String key = cell.getStringCellValue();
                    String substring = key.substring(key.lastIndexOf("$"), key.lastIndexOf("}") + 1);
                    if (tagDataMap.get(substring) != null) {
                        String s = key.replace(substring, (String) tagDataMap.get(substring));
                        cell.setCellValue(s);
                        cellValueMap.put(cell.getAddress().toString(), s);
                    } else {
                        cell.setCellValue(0);
                        cellValueMap.put(cell.getAddress().toString(), 0);
                    }
                }
            }
        }
    }

    private static void updateChartWithNewData(XWPFChart chart, XSSFWorkbook updatedWorkbook) throws IOException {
        // 图表数据更新的逻辑...
        // 评论或者私信即可领取
    }

    public static void main(String[] args) throws IOException {
        // 创建一个示例对象,填充数据
        ChartData chartData = new ChartData("value_079", "Branch A", "value_091");

        // 修改 Word 文件
        File wordFile = new File("D:\\Desktop\\GZRC_ceshi.docx");  // 修改为你的 Word 文件路径
        updateChartInWord(wordFile, chartData);
    }
}

代码详解

  • 读取 Word 文件 :首先,我们使用 XWPFDocument 从 Word 文件中读取数据。

  • 提取 Excel 数据源 :通过 getChartDataAsWorkbook 获取图表数据源,即嵌入在图表中的 Excel 文件。

  • 修改数据modifyChartData 方法根据需求修改 Excel 中的单元格数据,使用 tagDataMap 中的数据进行替换。

  • 更新图表 :在 updateChartWithNewData 方法中,我们将修改后的数据更新回图表。

  • 保存更新的 Word 文件 :最后,通过 document.write(fos) 将修改后的文件保存回磁盘。

总结

使用 Apache POI 处理 Word 文件中的图表更新是一项非常有用的技能,尤其是在自动化报告生成的过程中。通过对图表数据源(嵌入的 Excel 文件)进行修改,我们可以实现动态更新图表数据并更新 Word 文档,从而大大提高工作效率。

如果你有任何问题,或者遇到困难,欢迎在评论区留言。希望这篇文章能对你有所帮助!


相关推荐
magic 2452 小时前
内存中的缓存区
java·开发语言
原来是猿3 小时前
蓝桥备赛(四)- 数组(上)
开发语言·c++·sql·算法
仟濹3 小时前
【Python在校课堂笔记】Python第1节课 【课下总结】
开发语言·笔记·python
Matlab程序猿小助手4 小时前
【MATLAB源码-第268期】基于simulink的永磁同步电机PMSM双闭环矢量控制系统SVPWM仿真,输出转速响应曲线。
开发语言·人工智能·单片机·嵌入式硬件·算法·matlab·simulink
m0_748246354 小时前
Java进阶,时间与日期,包装类,正则表达式
java·mysql·正则表达式
微臣愚钝4 小时前
会话与会话管理:Cookie与Session的深度解析
java
熊文豪5 小时前
IDEA集成DeepSeek,通过离线安装解决无法安装Proxy AI插件问题
java·intellij-idea·deepseek·proxy ai·离线安装proxy ai·idea集成deepseek·保姆级教程
元气满满的码农5 小时前
删除idea recent projects 记录
java·ide·intellij-idea
boring_1115 小时前
【无标题】
java·数据库
何似在人间5755 小时前
JAVA中23种设计模式(详解)
java·开发语言·设计模式