Java获取excel附件并解析解决方案

使用Apache POI处理Excel中的OLE对象

核心代码解析

ini 复制代码
import org.apache.poi.poifs.filesystem.Ole10Native;
import org.apache.poi.poifs.filesystem.Ole10NativeException;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;

try (XSSFWorkbook workbook = new XSSFWorkbook(file.getInputStream())) {
    // 获取所有嵌入式文件
    List<PackagePart> partList = workbook.getAllEmbeddedParts();
    for (PackagePart part : partList) {
        InputStream emb = part.getInputStream();
        if (emb != null) {
            // 解析ole文件
            POIFSFileSystem fs = new POIFSFileSystem(emb);
            Ole10Native ole = Ole10Native.createFromEmbeddedOleObject(fs.getRoot());
            // 获取并处理原始文件名
            String originalName = ole.getLabel();
            // 获取文件内容
            byte[] fileContent = ole.getDataBuffer();
            // 这里可以添加业务处理逻辑
        }
    }
} catch (RuntimeException e) {
    throw new RuntimeException(e);
}

1. 获取文件流

  • 从文件系统:new FileInputStream("path/to/file.xlsx")
  • 从上传的MultipartFile:file.getInputStream()

2. 加载Excel工作簿

使用XSSFWorkbook类加载XLSX格式的Excel文件:

java 复制代码
try (XSSFWorkbook workbook = new XSSFWorkbook(file.getInputStream())) {
}

try-with-resources语句确保工作簿在使用后自动关闭。

3. 获取所有嵌入式对象

getAllEmbeddedParts()方法返回工作簿中所有嵌入式对象的列表:

ini 复制代码
List<PackagePart> partList = workbook.getAllEmbeddedParts();

4. 处理每个嵌入式对象

遍历所有嵌入式对象:

scss 复制代码
for (PackagePart part : partList) {
    InputStream emb = part.getInputStream();
    if (emb != null) {
        // 处理输入流
    }
}

5. 解析OLE对象

使用POIFSFileSystem解析OLE对象:

ini 复制代码
POIFSFileSystem fs = new POIFSFileSystem(emb);
Ole10Native ole = Ole10Native.createFromEmbeddedOleObject(fs.getRoot());

6. 获取OLE对象信息

从OLE对象中提取有用信息:

ini 复制代码
String originalName = ole.getLabel();  // 原始文件名
byte[] fileContent = ole.getDataBuffer();  // 文件内容

实际应用场景

  1. 文件提取:将嵌入的OLE对象提取并保存到文件系统
  2. 内容分析:检查嵌入文件的内容是否符合安全要求
  3. 数据迁移:将嵌入对象转换为其他格式
  4. 文档审计:记录文档中所有嵌入对象的信息

参考文档poi.apache.org/apidocs/4.0...

相关推荐
lizhongxuan1 小时前
多Agent之间的区别
后端
青石路3 小时前
记一次多JDK版本问题的排查,一坑套一坑,差点没爬上来
java
杨充3 小时前
1.面向对象设计思想
后端
IT_陈寒4 小时前
Java的Date类又坑了我一次,改用时间戳真香
前端·人工智能·后端
systemPro4 小时前
2.6亿条设备数据,历史查询从超时到50ms,我做了什么
后端
要阿尔卑斯吗4 小时前
提示词优化启示:为什么“按顺序输出“比“关键度评分“更有效
后端
她的男孩5 小时前
后台接口加密别只会 HTTPS,ForgeAdmin 的 RSA + SM4/AES 源码拆解
后端·面试·开源
极光技术熊5 小时前
Spring AI 从入门到精通:构建你的 AI 开发知识体系
后端·github
程序员cxuan5 小时前
一句话,让你用上 GPT-5.6
人工智能·后端·程序员
远航_5 小时前
OpenSpec 完整详细介绍
前端·后端