一、问题描述
公司有个需求,就是调用方(我)需要把pdf文件转为Base64字符串作为参数传递为被调用方,以下是大致转换过程:
java
URL url = new URL("http://xxxx.pdf");
HttpURLConnection uc = (HttpURLConnection) url.openConnection();
uc.setConnectTimeout(30000);
uc.setReadTimeout(30000);
InputStream is = uc.getInputStream();
byte[] bytes=new byte[is.available()];
System.out.println("bytes = " + bytes);
is.read(bytes);
is.close();
String s = Base64Utils.encodeToString(bytes);
System.out.println("s = " + s);
结果就出现问题了,发现上传的文件有的可以正常打开,有的确打不开,如下图:
二、原因分析
经过分析排查以及查阅资料,才知道是这行代码出了问题:
java
byte[] bytes=new byte[is.available()];
用InputStream.available()方法,这个方法可以在读写操作前先得知数据流里有多少个字节可以读取。
需要注意的是,如果这个方法用在从本地文件读取数据时,一般不会遇到问题,但如果是用于网络操作,就经常会遇到一些麻烦。
这是因为网络通讯往往是间断性的,一串字节往往分几批进行发送。
例如对方发来字节长度100的数据,本地程序调用available()方法有时得到0,有时得到50,有时能得到100,大多数情况下是100。这可能是对方还没有响应,也可能是对方已经响应了,但是数据还没有送达本地。也许分3批到达,也许分两批,也许一次性到达。
三、解决方案
3.1 循环读取
java
public static byte[] streamToByteArray(InputStream in) throws IOException {
ByteArrayOutputStream output = new ByteArrayOutputStream();
byte[] buffer = new byte[4096];
int n;
while (-1 != (n = in.read(buffer))) {
output.write(buffer, 0, n);
}
return output.toByteArray();
}
3.2 借助commons-io工具
java
byte[] bytes = IOUtils.toByteArray(inputStream);
还有很多方案,就不一一赘述了。