Java获取excel附件并解析解决方案

使用Apache POI处理Excel中的OLE对象

核心代码解析

ini 复制代码
import org.apache.poi.poifs.filesystem.Ole10Native;
import org.apache.poi.poifs.filesystem.Ole10NativeException;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;

try (XSSFWorkbook workbook = new XSSFWorkbook(file.getInputStream())) {
    // 获取所有嵌入式文件
    List<PackagePart> partList = workbook.getAllEmbeddedParts();
    for (PackagePart part : partList) {
        InputStream emb = part.getInputStream();
        if (emb != null) {
            // 解析ole文件
            POIFSFileSystem fs = new POIFSFileSystem(emb);
            Ole10Native ole = Ole10Native.createFromEmbeddedOleObject(fs.getRoot());
            // 获取并处理原始文件名
            String originalName = ole.getLabel();
            // 获取文件内容
            byte[] fileContent = ole.getDataBuffer();
            // 这里可以添加业务处理逻辑
        }
    }
} catch (RuntimeException e) {
    throw new RuntimeException(e);
}

1. 获取文件流

  • 从文件系统:new FileInputStream("path/to/file.xlsx")
  • 从上传的MultipartFile:file.getInputStream()

2. 加载Excel工作簿

使用XSSFWorkbook类加载XLSX格式的Excel文件:

java 复制代码
try (XSSFWorkbook workbook = new XSSFWorkbook(file.getInputStream())) {
}

try-with-resources语句确保工作簿在使用后自动关闭。

3. 获取所有嵌入式对象

getAllEmbeddedParts()方法返回工作簿中所有嵌入式对象的列表:

ini 复制代码
List<PackagePart> partList = workbook.getAllEmbeddedParts();

4. 处理每个嵌入式对象

遍历所有嵌入式对象:

scss 复制代码
for (PackagePart part : partList) {
    InputStream emb = part.getInputStream();
    if (emb != null) {
        // 处理输入流
    }
}

5. 解析OLE对象

使用POIFSFileSystem解析OLE对象:

ini 复制代码
POIFSFileSystem fs = new POIFSFileSystem(emb);
Ole10Native ole = Ole10Native.createFromEmbeddedOleObject(fs.getRoot());

6. 获取OLE对象信息

从OLE对象中提取有用信息:

ini 复制代码
String originalName = ole.getLabel();  // 原始文件名
byte[] fileContent = ole.getDataBuffer();  // 文件内容

实际应用场景

  1. 文件提取:将嵌入的OLE对象提取并保存到文件系统
  2. 内容分析:检查嵌入文件的内容是否符合安全要求
  3. 数据迁移:将嵌入对象转换为其他格式
  4. 文档审计:记录文档中所有嵌入对象的信息

参考文档poi.apache.org/apidocs/4.0...

相关推荐
字节拾光录7 小时前
手机号存储避坑指南:从20亿级数据库实践看,为什么VARCHAR才是终极答案
java·数据库·oracle
IT_陈寒7 小时前
Redis性能翻倍的5个冷门技巧,90%开发者都不知道第3个!
前端·人工智能·后端
p***97617 小时前
SpringBoot(7)-Swagger
java·spring boot·后端
j***29488 小时前
springboot集成onlyoffice(部署+开发)
java·spring boot·后端
晨非辰8 小时前
C++ 波澜壮阔 40 年:从基础I/O到函数重载与引用的完整构建
运维·c++·人工智能·后端·python·深度学习·c++40周年
张较瘦_8 小时前
Springboot | Spring Boot 3 纯 JDBC 实现宠物管理系统增删改查(无 ORM 框架)
spring boot·后端·数据库开发
h***673710 小时前
SpringBoot整合easy-es
spring boot·后端·elasticsearch
叫致寒吧12 小时前
Tomcat详解
java·tomcat
S***267516 小时前
基于SpringBoot和Leaflet的行政区划地图掩膜效果实战
java·spring boot·后端