Java获取excel附件并解析解决方案

使用Apache POI处理Excel中的OLE对象

核心代码解析

ini 复制代码
import org.apache.poi.poifs.filesystem.Ole10Native;
import org.apache.poi.poifs.filesystem.Ole10NativeException;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;

try (XSSFWorkbook workbook = new XSSFWorkbook(file.getInputStream())) {
    // 获取所有嵌入式文件
    List<PackagePart> partList = workbook.getAllEmbeddedParts();
    for (PackagePart part : partList) {
        InputStream emb = part.getInputStream();
        if (emb != null) {
            // 解析ole文件
            POIFSFileSystem fs = new POIFSFileSystem(emb);
            Ole10Native ole = Ole10Native.createFromEmbeddedOleObject(fs.getRoot());
            // 获取并处理原始文件名
            String originalName = ole.getLabel();
            // 获取文件内容
            byte[] fileContent = ole.getDataBuffer();
            // 这里可以添加业务处理逻辑
        }
    }
} catch (RuntimeException e) {
    throw new RuntimeException(e);
}

1. 获取文件流

  • 从文件系统:new FileInputStream("path/to/file.xlsx")
  • 从上传的MultipartFile:file.getInputStream()

2. 加载Excel工作簿

使用XSSFWorkbook类加载XLSX格式的Excel文件:

java 复制代码
try (XSSFWorkbook workbook = new XSSFWorkbook(file.getInputStream())) {
}

try-with-resources语句确保工作簿在使用后自动关闭。

3. 获取所有嵌入式对象

getAllEmbeddedParts()方法返回工作簿中所有嵌入式对象的列表:

ini 复制代码
List<PackagePart> partList = workbook.getAllEmbeddedParts();

4. 处理每个嵌入式对象

遍历所有嵌入式对象:

scss 复制代码
for (PackagePart part : partList) {
    InputStream emb = part.getInputStream();
    if (emb != null) {
        // 处理输入流
    }
}

5. 解析OLE对象

使用POIFSFileSystem解析OLE对象:

ini 复制代码
POIFSFileSystem fs = new POIFSFileSystem(emb);
Ole10Native ole = Ole10Native.createFromEmbeddedOleObject(fs.getRoot());

6. 获取OLE对象信息

从OLE对象中提取有用信息:

ini 复制代码
String originalName = ole.getLabel();  // 原始文件名
byte[] fileContent = ole.getDataBuffer();  // 文件内容

实际应用场景

  1. 文件提取:将嵌入的OLE对象提取并保存到文件系统
  2. 内容分析:检查嵌入文件的内容是否符合安全要求
  3. 数据迁移:将嵌入对象转换为其他格式
  4. 文档审计:记录文档中所有嵌入对象的信息

参考文档poi.apache.org/apidocs/4.0...

相关推荐
冬夜戏雪8 分钟前
实习面经记录(十)
java·前端·javascript
skiy16 分钟前
java与mysql连接 使用mysql-connector-java连接msql
java·开发语言·mysql
平生不喜凡桃李28 分钟前
浅谈 Linux 中 namespace 相关系统调用
java·linux·服务器
zb2006412033 分钟前
CVE-2024-38819:Spring 框架路径遍历 PoC 漏洞复现
java·后端·spring
uzong42 分钟前
AI Agent 是什么,如何理解它,未来挑战和思考
人工智能·后端·架构
2401_8955213443 分钟前
spring-ai 下载不了依赖spring-ai-openai-spring-boot-starter
java·人工智能·spring
追逐时光者1 小时前
DotNetGuide突破了10K + Star,一份全面且免费的C#/.NET/.NET Core学习、工作、面试指南知识库!
后端·.net
何仙鸟1 小时前
GarmageSet下载和处理
java·开发语言
wefly20171 小时前
免安装!m3u8live.cn在线 M3U8 播放器,小白也能快速上手
java·开发语言·python·json·php·m3u8·m3u8在线转换
yuweiade1 小时前
springboot和springframework版本依赖关系
java·spring boot·后端