前言
平时我们会碰到一些字符编码的问题,比如我去年看一篇小说神秘复苏
的时候,给我提示编码不正确,显示的全是乱码,然后我了解了一些目前比较常见的编码类型,然后终于看到了我们的主角杨间,顺道了解了下面的知识,简单讲解一下😂
ASICII
这也是出的比较早的版本,包含基础的英文大小写、数字、特殊符号,对其他国家特有的文字却不支持
学过开发的应该都知道:4857数字、6590大写字母、97~122小写字母、其他特殊符号
ASICII对照表 就不拿出来的,太长了,一搜就是
GB2312
1980 年,中国发布了第一个汉字编码标准,也即 GB2312 ,全称 《信息交换用汉字编码字符集·基本集》,通常简称 GB ("国标"汉语拼音首字母), 共收录了 6763 个常用的汉字和字符,此标准于次年5月实施,它满足了日常 99% 汉字的使用需求
ps
:也是是我看小说文本无法正常显示给我推荐的一种编码
GBK
由于有些汉字是在 GB2312 标准发布之后才简化的,还有一些人名、繁体字、日语和朝鲜语中的汉字也没有包括在内,所以,在 GB2312 的基础上添加了这部分字符,就形成了 GBK ,全称 《汉字内码扩展规范》,共收录了两万多个汉字和字符,它完全兼容 GB2312
GBK 于 1995 年发布,不过它只是 "技术规范指导性文件",并不属于国家标准
GB18030
GB18030 全称《信息技术 中文编码字符集》 ,共收录七万多个汉字和字符, 它在 GBK 的基础上增加了中日韩语中的汉字 和 少数名族的文字及字符,完全兼容 GB2312,基本兼容 GBK
GB18030 发布过两个版本,第一版于 2000 年发布,称为 GB18030-2000,第二版于 2005 年发布,称为 GB18030-2005
他们之间关系
ASICII、GB2312、GBK、GB18030 之间的关系实际上属于包含关系,也就是从左到右分别为对方子集
