一文读懂Base64

Jinwen52902023-10-09 16:03

这几天在和第三方交互的时候，对方返回的数据是base64格式的数据，所以这两天又彻底捋了下Base64的来龙去脉。之前看过一篇文章说的非常好（再找到给加上链接），我在这不详细说明了，只说转换过程。

还是使用中文"爸"来举例说明，在之前的文章"一文彻底搞懂计算机中文编码"和"一文读懂UTF-8的编码规则"已了解到"爸"使用GBK编码后数据为"B0D6(10110000 11010110)"，使用utf-8编码数据为"E 7 8 8 B 8（1110 0111 1000 1000 1011 1000）"。

前边我们已经有了测试数据，那么Base64编码规则如下：

就是包括小写字母a-z、大写字母A-Z、数字0-9、符号"+"、"/"一共64个字符的字符集，（任何符号都可以转换成这个字符集中的字符，这个转换过程就叫做base64编码。

Base64 编码的字符索引表如下所示：

B0D6(10110000 11010110)转换过程如下：

像上边不够24位，只有16位，name最后一个四位低位同样补"00"，剩下的一个字节用"="补齐。

E 7 8 8 B 8（1110 0111 1000 1000 1011 1000）转换过程如下：

验证程序：

java 复制代码

    String str = "爸";
    System.out.println(Base64.encode(str.getBytes("gb2312")));
    System.out.println(Base64.encode(str.getBytes("utf-8")));

运行结果如下：