面试官:字节流可以处理一切文件为什么还需要字符流呢?

一、写在开头

在计算机领域中百分之九十以上的程序拥有着和外部设备交互的功能,这就是我们常说的IO(Input/Output:输入/输出),所谓输入就是外部数据导入计算机内存中的过程,输出则是将内存或者说程序中的数据导入到外部存储中,如数据库、文件以及其他本地磁盘等。

二、什么是IO流

这种输入输出往往遵循着先入先出,顺序存取的特点,像水流一般,因此我们称这样的操作为流(Stream),如下我们根据不同的标准,将IO流分为几个门类:

根据数据流向:

  1. 输入流:数据流向程序
  2. 输出流:数据从程序流出。

根据处理单位:

  1. 字节流:一次读入或读出是8位二进制;
  2. 字符流:一次读入或读出是16位二进制
  3. JDK 中后缀是 Stream 是字节流;后缀是 Reader,Writer 是字符流。

根据功能点:

  1. 节点流:直接与数据源相连,读入或写出;
  2. 处理流:与节点流一块使用,在节点流的基础上,再套接一层。

三、输入与输出

在java.io包中多达40多个类,它们的基类来源于InputStream、OutputStream、Reader、Writer这四个,我们一一看过。

3.1 InputStream(字节输入流)

InputStream作为所有字节输入流的父类,主要作用是将外部数据读取到内存中,主要方法如下(JDK8):

  1. read():返回输入流中下一个字节的数据。返回的值介于 0 到 255 之间。如果未读取任何字节,则代码返回 -1 ,表示文件结束。
  2. read(byte b[ ]) : 从输入流中读取一些字节存储到数组 b 中。如果数组 b 的长度为零,则不读取。如果没有可用字节读取,返回 -1。如果有可用字节读取,则最多读取的字节数最多等于 b.length , 返回读取的字节数。这个方法等价于 read(b, 0, b.length)。
  3. read(byte b[], int off, int len):在read(byte b[ ]) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字节数)。
  4. skip(long n):忽略输入流中的 n 个字节 ,返回实际忽略的字节数。
  5. available():返回输入流中可以读取的字节数。
  6. close():关闭输入流释放相关的系统资源。
  7. markSupported() :该输入流是否支持mark()和reset()方法。
  8. mark(int readlimit) :标志输入流的当前位置,随后调用reset()方法将该流重新定位到最近标记的位置;参数readlimit表示:在标记位置失效前可以读取字节的最大限制。
  9. reset() :将此流重新定位到最后一次对此输入流调用 mark 方法时的位置。

我们使用FileInputStream(文件字节输入流)进行如上方法的使用测试:

java 复制代码
public class Test {
    public static void main(String[] args) throws IOException {
        try (InputStream fis = new FileInputStream("E:\\input.txt")) {
            System.out.println("可读取字节数:"
                    + fis.available());
            int content;
            long skip = fis.skip(3);
            System.out.println("忽略字节数:" + skip);
            System.out.print("剩余全量字节:");
            while ((content = fis.read()) != -1) {
                System.out.print((char) content);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

输出:

java 复制代码
可读取字节数:20
忽略字节数:3
剩余全量字节:name is JavaBuild

3.2 OutputStream(字节输出流)

outputstream作为所有字节输出流的父类,主要则是将内存或者说程序中的数据以字节流的方式导入到外部存储中,如数据库、文件以及其他本地磁盘等。它的使用方法相比较字节输入流要少:

  1. write(int b):将特定字节写入输出流。
  2. write(byte b[ ]) : 将数组b 写入到输出流,等价于 write(b, 0, b.length) 。
  3. write(byte[] b, int off, int len) : 在write(byte b[ ]) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字节数)。
  4. flush():刷新此输出流并强制写出所有缓冲的输出字节。
  5. close():关闭输出流释放相关的系统资源。

我们同样以FileOutputStream为例进行上述方法的测试:

java 复制代码
public class Test {
    public static void main(String[] args) throws IOException {
        try (FileOutputStream output = new FileOutputStream("E://output.txt")) {
            byte[] array = "JavaBuild".getBytes();
            //将一个字节数组写入本地E盘的外部文件output.txt中
            output.write(array);

            //换行方式1:Windows下的换行符为"\r\n"
            output.write("\r\n".getBytes());
            //换行方式2:推荐使用,具有良好的跨平台性
            String newLine = System.getProperty("line.separator");
            output.write(newLine.getBytes());

            //输出字节,这里的数字会被转为asicc码中对应的字符
            output.write(64);
            output.write(56);
            output.write(56);
            output.write(56);
            //关闭输出流
            output.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

效果:

这里可以直接输出单字节数据,也可以输出指定的字节数组。输出字节时以int类型输出,最终根据ASCII表转为字符。如十进制64的转为@符号。

3.3 Reader(字符输入流)

在讲解字符流之前,我们来解释一个面试问题:"为什么有了字节流了还需要使用更耗时的字符流"

确实,字节作为信息存储的最小单元,我们可以通过字节流实现所有信息的输入与输出,但有时候会存在一些问题,比如中文输入时的编码问题,将上述3.1中的测试代码稍微改一下,执行结果如下,中文在控制台输出时乱码了。当然我们可以通过设置编码来规避这个问题,但有时候不晓得编码时,乱码真的会带来潜在风险!

字符流与字节流的区别:

  • 字节流一般用来处理图像、视频、音频、PPT、Word等类型的文件。字符流一般用于处理纯文本类型的文件,如TXT文件等,但不能处理图像视频等非文本文件。
  • 字节流本身没有缓冲区,缓冲字节流相对于字节流,效率提升非常高。而字符流本身就带有缓冲区,缓冲字符流相对于效率提升不明显。

说了这么多,我们现在来看一下Reader这个字符输入流提供的主要方法吧,其实和InputStream差不多,只不过一个是以字节为单位的读取,一个是以字符为单位。

  1. read() : 从输入流读取一个字符。
  2. read(char[] cbuf) : 从输入流中读取一些字符,并将它们存储到字符数组 cbuf中,等价于 read(cbuf, 0, cbuf.length) 。
  3. read(char[] cbuf, int off, int len):在read(char[] cbuf) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  4. skip(long n):忽略输入流中的 n 个字符 ,返回实际忽略的字符数。
  5. close() : 关闭输入流并释放相关的系统资源。

我们将上述3.1中的测试代码稍作加工,采用FileReader流进行输入,打印结果:

可以看到即便有中文,输出在控制台也没有乱码,因为字符流默认采用的是 Unicode 编码。

那么字符流是如何实现txt文件读取的呢?通过FileReader类的继承关系我们可以看到它继承了InputStreamReader,这是一个字节转字符输入流,所以说从根本上,字符流底层依赖的还是字节流!

java 复制代码
// 字节流转换为字符流的桥梁
public class InputStreamReader extends Reader {
}
// 用于读取字符文件
public class FileReader extends InputStreamReader {
}

3.4 Writer(字符输出流)

writer是将内存或者说程序中的数据以字符流的方式导入到外部存储中,如数据库、文件以及其他本地磁盘等。

常用方法也和OutputStream相似:

  1. write(int c) : 写入单个字符。
  2. write(char[] cbuf):写入字符数组 cbuf,等价于write(cbuf, 0, cbuf.length)。
  3. write(char[] cbuf, int off, int len):在write(char[] cbuf) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  4. write(String str):写入字符串,等价于 write(str, 0, str.length()) 。
  5. write(String str, int off, int len):在write(String str) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  6. append(CharSequence csq):将指定的字符序列附加到指定的 Writer 对象并返回该 Writer 对象。
  7. append(char c):将指定的字符附加到指定的 Writer 对象并返回该 Writer 对象。
  8. flush():刷新此输出流并强制写出所有缓冲的输出字符。
  9. close():关闭输出流释放相关的系统资源。

我们同样以FileWriter为例,去测试一下:

java 复制代码
public class Test {
    public static void main(String[] args) throws IOException {
        try (FileWriter fw = new FileWriter("E:\\outwriter.txt")) {
           fw.write("大家好!!!");
           fw.append("我是JavaBuild");
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

结尾彩蛋

如果本篇博客对您有一定的帮助,大家记得留言+点赞+收藏呀。原创不易,转载请联系Build哥!

如果您想与Build哥的关系更近一步,还可以关注"JavaBuild888",在这里除了看到《Java成长计划》系列博文,还有提升工作效率的小笔记、读书心得、大厂面经、人生感悟等等,欢迎您的加入!

相关推荐
JavaBuild1 个月前
《一篇就够系列》之HTTP详解,覆盖高频面试考点!
java成长计划
JavaBuild1 个月前
坑爹面试官,一个网络连通性,把我干哑火了,无理取闹还是我太菜?
java成长计划
JavaBuild1 个月前
优秀的面试官!通过一个问题考察了所有网络编程知识点
java成长计划
JavaBuild2 个月前
NIO实现聊天室之:一切都要从网络编程的基础开始聊起!
java成长计划
JavaBuild4 个月前
NIO的三大核心组件详解,充分说明为什么NIO在网络IO中拥有高性能!
java成长计划
JavaBuild5 个月前
面试官:transient关键字修饰的变量当真不可序列化?我:烦请先生教我!
java成长计划
JavaBuild5 个月前
面试官:告诉我为什么static和transient关键字修饰的变量不能被序列化?
java成长计划
JavaBuild5 个月前
关于面试被面试官暴怼:“几年研究生白读” 的前因后果
java成长计划
JavaBuild5 个月前
面试官:Java中缓冲流真的性能很好吗?我看未必
java成长计划