【问题解决】apache.poi 3.1.4版本升级到 5.2.3,导出文件报错版本无法解析

【问题解决】apache.poi 3.1.4版本升级到 5.2.3,导出文件报错无法解析

3.1.4版本代码:

bash 复制代码
    /**
     * 创建workbook
     * @param inp
     * @return
     * @throws Exception
     */
    public Workbook createworkbook(InputStream inp) throws Exception {


        if (!inp.markSupported()) {
            inp = new PushbackInputStream(inp, 8);
        }

        if (POIFSFileSystem.hasPOIFSHeader(inp)) {
            return new HSSFWorkbook(inp);
        }
        if (POIXMLDocument.hasOOXMLHeader(inp)) {
            return new XSSFWorkbook(OPCPackage.open(inp));
        }
        throw new IllegalArgumentException("你的excel版本目前poi解析不了");
    }

在POI 4.0.x版本过后,POIFSFileSystem.hasPOIFSHeader() POIXMLDocument.hasOOXMLHeader()便弃用了,所以我们需要找到新版本的替代方法,为此查阅了不少资料。

这里有两个方案可以参考一下:

java 复制代码
public Workbook createworkbook(InputStream inp) throws Exception {
    try (PushbackInputStream pushbackInputStream = new PushbackInputStream(inp, 8)) {
        byte[] header = new byte[8];
        int read = pushbackInputStream.read(header);
        pushbackInputStream.unread(header, 0, read);

        if (POIUtils.hasOOXMLHeader(header)) {
            return new XSSFWorkbook(OPCPackage.open(pushbackInputStream));
        } else if (POIUtils.hasPOIFSHeader(header)) {
            return new HSSFWorkbook(pushbackInputStream);
        } else {
            throw new IllegalArgumentException("不支持的 Excel 格式");
        }
    }
}

主要变更如下:

  1. 使用 POIUtils.hasOOXMLHeader(header) 方法替换 POIDataSamples.getSpreadSheetInstance().acceptsFile(header) 方法。这个方法可以检测 XSSF 格式(OOXML)。
  2. 使用 POIUtils.hasPOIFSHeader(header) 方法检测 HSSF 格式(97-2003 Excel)。
  3. 如果以上两种方式都无法识别,则抛出一个自定义的异常。

这种方式可以有效地替换之前的代码,并适用于 Apache POI 5.2.3 版本。

需要注意的是,需要引入 org.apache.poi.util.POIUtils 类,这个类是 Apache POI 5.2.3 中新增的一个工具类,提供了一些常用的工具方法。
2.

java 复制代码
public Workbook createworkbook(InputStream inp) throws Exception {
    try (PushbackInputStream pushbackInputStream = new PushbackInputStream(inp, 8)) {
        byte[] header = new byte[8];
        int read = pushbackInputStream.read(header);
        pushbackInputStream.unread(header, 0, read);

        if (isXSSF(header)) {
            return new XSSFWorkbook(OPCPackage.open(pushbackInputStream));
        } else if (isHSSF(header)) {
            return new HSSFWorkbook(pushbackInputStream);
        } else {
            throw new IllegalArgumentException("不支持的 Excel 格式");
        }
    }
}

private boolean isXSSF(byte[] header) {
    // 检查 OOXML 文件头标识
    return header[0] == (byte) 0x50 && header[1] == (byte) 0x4B && header[2] == (byte) 0x03 && header[3] == (byte) 0x04;
}

private boolean isHSSF(byte[] header) {
    // 检查 POIFS 文件头标识
    return header[0] == (byte) 0xD0 && header[1] == (byte) 0xCF && header[2] == (byte) 0x11 && header[3] == (byte) 0xE0;
}	

这个替代方案中,自己实现了 isXSSFisHSSF 方法来检测 OOXML 和 POIFS 文件头标识,达到了同样的效果。

踩坑啊!

相关推荐
卓越小Y15 分钟前
配置jellyfin docker 硬件加速
java·spring cloud·docker
白萝卜弟弟18 分钟前
【JAVA】正则表达式中的捕获组和非捕获组
java·正则表达式
袁庭新38 分钟前
LuaRocks如何安装数据库驱动?
java·数据库·redis·lua·luarocks·袁庭新
hummhumm1 小时前
第 10 章 - Go语言字符串操作
java·后端·python·sql·算法·golang·database
nukix1 小时前
Mac Java 使用 tesseract 进行 ORC 识别
java·开发语言·macos·orc
月光光心慌慌。1 小时前
新日撸java三百行` 新手小白java学习记录 `Day1
java
蘑菇丁1 小时前
ranger-kms安装
java·ide·eclipse
XiaoLeisj1 小时前
【JavaEE初阶 — 多线程】内存可见性问题 & volatile
java·开发语言·java-ee
weixin_462428471 小时前
使用 Caffeine 缓存并在业务方法上通过注解实现每3到5秒更新缓存
java·缓存
程序媛小果1 小时前
基于java+SpringBoot+Vue的桂林旅游景点导游平台设计与实现
java·vue.js·spring boot