inputStream.avaliable()方法网络操作读取不全BUG

一、问题描述

公司有个需求,就是调用方(我)需要把pdf文件转为Base64字符串作为参数传递为被调用方,以下是大致转换过程:

java 复制代码
        URL url = new URL("http://xxxx.pdf");
        HttpURLConnection uc = (HttpURLConnection) url.openConnection();
        uc.setConnectTimeout(30000);
        uc.setReadTimeout(30000);
        InputStream is = uc.getInputStream();
        byte[] bytes=new byte[is.available()];
        System.out.println("bytes = " + bytes);
        is.read(bytes);
        is.close();
        String s = Base64Utils.encodeToString(bytes);
        System.out.println("s = " + s);

结果就出现问题了,发现上传的文件有的可以正常打开,有的确打不开,如下图:

二、原因分析

经过分析排查以及查阅资料,才知道是这行代码出了问题:

java 复制代码
byte[] bytes=new byte[is.available()];

用InputStream.available()方法,这个方法可以在读写操作前先得知数据流里有多少个字节可以读取。

需要注意的是,如果这个方法用在从本地文件读取数据时,一般不会遇到问题,但如果是用于网络操作,就经常会遇到一些麻烦。

这是因为网络通讯往往是间断性的,一串字节往往分几批进行发送。

例如对方发来字节长度100的数据,本地程序调用available()方法有时得到0,有时得到50,有时能得到100,大多数情况下是100。这可能是对方还没有响应,也可能是对方已经响应了,但是数据还没有送达本地。也许分3批到达,也许分两批,也许一次性到达。

三、解决方案

3.1 循环读取

java 复制代码
public static byte[] streamToByteArray(InputStream in) throws IOException {
    ByteArrayOutputStream output = new ByteArrayOutputStream();
    byte[] buffer = new byte[4096];
    int n;
    while (-1 != (n = in.read(buffer))) {
         output.write(buffer, 0, n);
       }
    return output.toByteArray();
}

3.2 借助commons-io工具

java 复制代码
byte[] bytes = IOUtils.toByteArray(inputStream);

还有很多方案,就不一一赘述了。

相关推荐
中冕—霍格沃兹软件开发测试15 小时前
探索性测试:思维驱动下的高效缺陷狩猎
人工智能·科技·开源·appium·bug
中冕—霍格沃兹软件开发测试21 小时前
Git版本控制在测试项目管理中的应用
人工智能·git·科技·开源·appium·bug
中冕—霍格沃兹软件开发测试1 天前
用户体验测试:功能与界面并重
人工智能·科技·开源·appium·bug·ux
中冕—霍格沃兹软件开发测试2 天前
测试工具链的构建与团队协作:从工具集成到价值流动
人工智能·科技·测试工具·开源·appium·bug
yuxuan66992 天前
【Docker】使用docker启动禅道出现mysql.sock 文件已经存在的bug
mysql·docker·centos·bug
zfxwasaboy2 天前
BUG: failure at drivers/pci/msi.c:376/free_msi_irqs()!
linux·c语言·bug
yscript2 天前
GPU分配BUG: Duplicate GPU detected : rank 1 and rank 0 both on CUDA device d5000
linux·运维·服务器·vscode·bug
xiucai_cs2 天前
【后端】开发过程中如何尽可能的减少 bug 的产生
后端·bug
大江东去浪淘尽千古风流人物2 天前
【bug】bug记录学习,Win系统下爆栈的表现, chkstk.asm 实际是栈溢出
学习·bug
木棉知行者3 天前
【第2篇】RuntimeError: nms_impl: implementation for device cuda:0 not found.
人工智能·深度学习·bug·mmdetection