Java获取excel附件并解析解决方案

使用Apache POI处理Excel中的OLE对象

核心代码解析

ini 复制代码
import org.apache.poi.poifs.filesystem.Ole10Native;
import org.apache.poi.poifs.filesystem.Ole10NativeException;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;

try (XSSFWorkbook workbook = new XSSFWorkbook(file.getInputStream())) {
    // 获取所有嵌入式文件
    List<PackagePart> partList = workbook.getAllEmbeddedParts();
    for (PackagePart part : partList) {
        InputStream emb = part.getInputStream();
        if (emb != null) {
            // 解析ole文件
            POIFSFileSystem fs = new POIFSFileSystem(emb);
            Ole10Native ole = Ole10Native.createFromEmbeddedOleObject(fs.getRoot());
            // 获取并处理原始文件名
            String originalName = ole.getLabel();
            // 获取文件内容
            byte[] fileContent = ole.getDataBuffer();
            // 这里可以添加业务处理逻辑
        }
    }
} catch (RuntimeException e) {
    throw new RuntimeException(e);
}

1. 获取文件流

  • 从文件系统:new FileInputStream("path/to/file.xlsx")
  • 从上传的MultipartFile:file.getInputStream()

2. 加载Excel工作簿

使用XSSFWorkbook类加载XLSX格式的Excel文件:

java 复制代码
try (XSSFWorkbook workbook = new XSSFWorkbook(file.getInputStream())) {
}

try-with-resources语句确保工作簿在使用后自动关闭。

3. 获取所有嵌入式对象

getAllEmbeddedParts()方法返回工作簿中所有嵌入式对象的列表:

ini 复制代码
List<PackagePart> partList = workbook.getAllEmbeddedParts();

4. 处理每个嵌入式对象

遍历所有嵌入式对象:

scss 复制代码
for (PackagePart part : partList) {
    InputStream emb = part.getInputStream();
    if (emb != null) {
        // 处理输入流
    }
}

5. 解析OLE对象

使用POIFSFileSystem解析OLE对象:

ini 复制代码
POIFSFileSystem fs = new POIFSFileSystem(emb);
Ole10Native ole = Ole10Native.createFromEmbeddedOleObject(fs.getRoot());

6. 获取OLE对象信息

从OLE对象中提取有用信息:

ini 复制代码
String originalName = ole.getLabel();  // 原始文件名
byte[] fileContent = ole.getDataBuffer();  // 文件内容

实际应用场景

  1. 文件提取:将嵌入的OLE对象提取并保存到文件系统
  2. 内容分析:检查嵌入文件的内容是否符合安全要求
  3. 数据迁移:将嵌入对象转换为其他格式
  4. 文档审计:记录文档中所有嵌入对象的信息

参考文档poi.apache.org/apidocs/4.0...

相关推荐
invicinble3 小时前
这里对java的知识体系做一个全域的介绍
java·开发语言·python
小码哥_常3 小时前
MyBatis-Plus:让数据库操作飞起来的神器
后端
wbs_scy3 小时前
【Linux 线程进阶】进程 vs 线程资源划分 + 线程控制全详解
java·开发语言
ss2733 小时前
食谱推荐系统功能测试如何写?
java·数据库·spring boot·功能测试
2301_811274314 小时前
基于SpringBoot的智能家居管理系统
spring boot·后端·智能家居
AI人工智能+电脑小能手4 小时前
【大白话说Java面试题】【Java基础篇】第15题:JDK1.7中HashMap扩容为什么会发生死循环?如何解决
java·开发语言·数据结构·后端·面试·哈希算法
舒一笑4 小时前
我把设备指纹生成逻辑拆开了:它到底凭什么区分不同设备?
后端·程序员·掘金技术征文
try2find4 小时前
打印ascii码报错问题
java·linux·前端
014-code4 小时前
CompletableFuture 实战模板(超时、组合、异常链处理)
java·数据库
Nicander4 小时前
多数据源下@transcation事务踩坑
java·后端