Java获取excel附件并解析解决方案

使用Apache POI处理Excel中的OLE对象

核心代码解析

ini 复制代码
import org.apache.poi.poifs.filesystem.Ole10Native;
import org.apache.poi.poifs.filesystem.Ole10NativeException;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;

try (XSSFWorkbook workbook = new XSSFWorkbook(file.getInputStream())) {
    // 获取所有嵌入式文件
    List<PackagePart> partList = workbook.getAllEmbeddedParts();
    for (PackagePart part : partList) {
        InputStream emb = part.getInputStream();
        if (emb != null) {
            // 解析ole文件
            POIFSFileSystem fs = new POIFSFileSystem(emb);
            Ole10Native ole = Ole10Native.createFromEmbeddedOleObject(fs.getRoot());
            // 获取并处理原始文件名
            String originalName = ole.getLabel();
            // 获取文件内容
            byte[] fileContent = ole.getDataBuffer();
            // 这里可以添加业务处理逻辑
        }
    }
} catch (RuntimeException e) {
    throw new RuntimeException(e);
}

1. 获取文件流

  • 从文件系统:new FileInputStream("path/to/file.xlsx")
  • 从上传的MultipartFile:file.getInputStream()

2. 加载Excel工作簿

使用XSSFWorkbook类加载XLSX格式的Excel文件:

java 复制代码
try (XSSFWorkbook workbook = new XSSFWorkbook(file.getInputStream())) {
}

try-with-resources语句确保工作簿在使用后自动关闭。

3. 获取所有嵌入式对象

getAllEmbeddedParts()方法返回工作簿中所有嵌入式对象的列表:

ini 复制代码
List<PackagePart> partList = workbook.getAllEmbeddedParts();

4. 处理每个嵌入式对象

遍历所有嵌入式对象:

scss 复制代码
for (PackagePart part : partList) {
    InputStream emb = part.getInputStream();
    if (emb != null) {
        // 处理输入流
    }
}

5. 解析OLE对象

使用POIFSFileSystem解析OLE对象:

ini 复制代码
POIFSFileSystem fs = new POIFSFileSystem(emb);
Ole10Native ole = Ole10Native.createFromEmbeddedOleObject(fs.getRoot());

6. 获取OLE对象信息

从OLE对象中提取有用信息:

ini 复制代码
String originalName = ole.getLabel();  // 原始文件名
byte[] fileContent = ole.getDataBuffer();  // 文件内容

实际应用场景

  1. 文件提取:将嵌入的OLE对象提取并保存到文件系统
  2. 内容分析:检查嵌入文件的内容是否符合安全要求
  3. 数据迁移:将嵌入对象转换为其他格式
  4. 文档审计:记录文档中所有嵌入对象的信息

参考文档poi.apache.org/apidocs/4.0...

相关推荐
张张张3126 分钟前
4.2学习总结 Java:list系列集合
java·学习
KATA~9 分钟前
解决MyBatis-Plus枚举映射错误:No enum constant问题
java·数据库·mybatis
xyliiiiiL25 分钟前
一文总结常见项目排查
java·服务器·数据库
shaoing27 分钟前
MySQL 错误 报错:Table ‘performance_schema.session_variables’ Doesn’t Exist
java·开发语言·数据库
Asthenia041228 分钟前
由浅入深解析Redis事务机制及其业务应用-电商场景解决超卖
后端
Asthenia041229 分钟前
Redis详解:从内存一致性到持久化策略的思维链条
后端
Asthenia041229 分钟前
深入剖析 Redis 持久化:RDB 与 AOF 的全景解析
后端
Apifox40 分钟前
如何在 Apifox 中通过 CLI 运行包含云端数据库连接配置的测试场景
前端·后端·程序员
掘金一周1 小时前
金石焕新程 >> 瓜分万元现金大奖征文活动即将回归 | 掘金一周 4.3
前端·人工智能·后端
uhakadotcom1 小时前
构建高效自动翻译工作流:技术与实践
后端·面试·github