字符集及其编码、解码操作、IO流分类

字符集

1、ASCII字符集:一个字节(8位)存储一个字符(大小写字母,数字或特殊符号)

2、ASCII字符集中一个字节八位实际有效的只有后七位,第一位都是0

3、GBK字符集(汉字内码扩展规范,国标)包括了ASCII,两个字节存储一个汉字字符

4、GBK规定:汉字的第一个字节的第一位必须是1,与ASCII第一位必须是0区分开来,用于在一句话中区分ASCII(一个字节)和GBK(两个字节)

5、Unicode字符集(统一码,也叫万国码),UTF-32字符集每四个字节表示一个字符,虽然容纳的多,但是占空间多,通信效率变低

6、UTF-8字符集是Unicode字符集的一种编码方案,长度区分1个字节、2个字节、3个字节、4个字节。技术

要点回顾

字符编码和解码时使用的字符集必须一样,否则会出现乱码,

字符集的编码、解码操作

java 复制代码
package com.itheima.demo3character;

import java.io.UnsupportedEncodingException;
import java.nio.charset.Charset;
import java.util.Arrays;

public class CharSetDemo1 {
    public static void main(String[] args) throws UnsupportedEncodingException {
        //目标:写程序实现字符编码和解码
        //1、编码(成字节形式,再转化成十进制)
        String name = "本尊!!!";
        byte[] bytes = name.getBytes("GBK");//指定GBK进行编码
        System.out.println(bytes.length);//7
        System.out.println(Arrays.toString(bytes));//[-79, -66, -41, -16, 33, 33, 33]

        //2、解码(成我能看懂的)
        //String name2 = new String(bytes);//编码与解码不一致,会乱码
        String name3 = new String(bytes, "GBK");//指定GBK进行解码
        //System.out.println(name2);//����!!!
        System.out.println(name3);//本尊!!!
    }
}

IO流

I指Input,称为输入流:富足把数据读到内存中去

O指Ouput,称为输出流:负责写数据出去

IO流的分类

IO流的体系:字节输入流、字节输出流、字符输入流、字符输出流

小结

IO流-文件字节输入流

1、字节输入流InputStream、字节输出流OutputStream、字符输入流Reader、字符输出流Writer都是抽象类

2、FileInputStream、FileOutputStream、FileReader、FileWriter是对应以上的实现类

3、文件字节输入流FileInputStream的作用是把磁盘文件中的数据以字节的形式读入到内存中去

java 复制代码
package com.itheima.demo4fileinputstream;

import java.io.*;

public class FileInputDemo1 {
    public static void main(String[] args) throws IOException {
        //目标:掌握文件字节输入流读取文件中的字节数组到内存中来
        //1、创建文件字节对象  输入流管道于源文件接通
        InputStream is = new FileInputStream(new File("day03-file-io\\src\\lll02"));
        //2、创建文件字节路径  输入流管道与源文件接通
        //InputStream is2 = new FileInputStream("day03-file-io\\src\\lll02");//两个是一样的,简化写法
        InputStream is2 = new FileInputStream("day03-file-io\\src\\lll03");

        //3、读取文件中的字节并输出
        //定义一个变量记住每次读取的一个字节
        int b;
        while ((b = is.read()) != -1)//按顺序判断内容对应的ASCII字符是否等于-1
        {
            System.out.print((char) b);
        }
        //每次读取一个字节的问题,性能较差,读取汉字输出一定会乱码


        //4、读取文件中的字节数组并输出,每次读取多个字节
        //定义一个字节数组,每次读取多个字节
        byte[] bytes = new byte[3];
        //定义一个变量记住每次读取多少个字节,读取多少倒多少
        int len;
        while ((len = is2.read(bytes)) != -1) {
            System.out.println(new String(bytes, 0, len));//abc
                                                                //666
                                                                //g
        }
    }
}
java 复制代码
//一次性读完文件的全部字节,避免读取汉字输出乱码的问题,缺点:内存过大时不适合使用
        byte[] bytes1 = is.readAllBytes();
        String s = new String(bytes1);
        System.out.println(s);

小结

1、文件字节输入流,读取文件数据的步骤?

创建文件字节路径 输入流管道与源文件接通 / 创建文件字节对象 输入流管道于源文件接通

2、如何使用字节输入流读取中文内容输出时不乱码呢?

一次性读完文件的全部字节,避免读取汉字输出乱码的问题,但缺点:内存过大时不适合使用

相关推荐
hanqunfeng1 小时前
(三十三)Redisson 实战
java·spring boot·后端
计算机毕设指导62 小时前
基于微信小程序的运动场馆服务系统【源码文末联系】
java·spring boot·微信小程序·小程序·tomcat·maven·intellij-idea
无名的小三轮2 小时前
第三章 防火墙概述
开发语言·php
冰暮流星2 小时前
javascript的switch语句介绍
java·前端·javascript
有梦想的攻城狮2 小时前
Java中的Double类型的存在精度丢失详解
java·开发语言·bigdecimal·double
一路往蓝-Anbo2 小时前
【第42期】调试进阶(一):IDE中的Register与Memory窗口
c语言·开发语言·ide·stm32·单片机·嵌入式硬件
m0_748249542 小时前
Java 语言提供了八种基本类型【文123】
java·开发语言·python
移幻漂流2 小时前
Kotlin 如何解决 Java 的核心痛点:现代语言特性的深度剖析
java·python·kotlin
leikooo2 小时前
ShardingSphere 下更新分片键导致的失败问题分析与解决
java·spring·apache