ASICII、CG2312、GBK、GB18030

前言

平时我们会碰到一些字符编码的问题,比如我去年看一篇小说神秘复苏的时候,给我提示编码不正确,显示的全是乱码,然后我了解了一些目前比较常见的编码类型,然后终于看到了我们的主角杨间,顺道了解了下面的知识,简单讲解一下😂

ASICII

这也是出的比较早的版本,包含基础的英文大小写、数字、特殊符号,对其他国家特有的文字却不支持

学过开发的应该都知道:4857数字、6590大写字母、97~122小写字母、其他特殊符号

ASICII对照表 就不拿出来的,太长了,一搜就是

GB2312

1980 年,中国发布了第一个汉字编码标准,也即 GB2312 ,全称 《信息交换用汉字编码字符集·基本集》,通常简称 GB ("国标"汉语拼音首字母), 共收录了 6763 个常用的汉字和字符,此标准于次年5月实施,它满足了日常 99% 汉字的使用需求

ps:也是是我看小说文本无法正常显示给我推荐的一种编码

GBK

由于有些汉字是在 GB2312 标准发布之后才简化的,还有一些人名、繁体字、日语和朝鲜语中的汉字也没有包括在内,所以,在 GB2312 的基础上添加了这部分字符,就形成了 GBK ,全称 《汉字内码扩展规范》,共收录了两万多个汉字和字符,它完全兼容 GB2312

GBK 于 1995 年发布,不过它只是 "技术规范指导性文件",并不属于国家标准

GB18030

GB18030 全称《信息技术 中文编码字符集》 ,共收录七万多个汉字和字符, 它在 GBK 的基础上增加了中日韩语中的汉字 和 少数名族的文字及字符,完全兼容 GB2312,基本兼容 GBK

GB18030 发布过两个版本,第一版于 2000 年发布,称为 GB18030-2000,第二版于 2005 年发布,称为 GB18030-2005

他们之间关系

ASICII、GB2312、GBK、GB18030 之间的关系实际上属于包含关系,也就是从左到右分别为对方子集

相关推荐
弗锐土豆7 小时前
程序员之电工基础-初尝线扫相机
程序员·工控·线扫相机·电工
redreamSo19 小时前
长大后为什么时间越来越快?我们活的是记忆并非时间,人生是由故事组成的
程序员
唐叔在学习21 小时前
盘点IDEA中那些实用的GIT小技巧
程序员·intellij idea
周小董2 天前
[1336]python rich库
程序员
摆烂工程师2 天前
教你如何认证 Gemini 教育优惠的二次验证,薅个 1年的 Gemini Pro 会员
后端·程序员·gemini
考虑考虑2 天前
Redis8中的布谷鸟过滤器
redis·后端·程序员
我要改名叫嘟嘟2 天前
程序员找“出路”之写作读书满五年
程序员
文心快码 Baidu Comate2 天前
AI界的“超能力”MCP,到底是个啥?
人工智能·程序员·ai编程·文心快码·comate zulu
周小董2 天前
[1335]pyperclip模块安装和使用
程序员