ASICII、CG2312、GBK、GB18030

前言

平时我们会碰到一些字符编码的问题,比如我去年看一篇小说神秘复苏的时候,给我提示编码不正确,显示的全是乱码,然后我了解了一些目前比较常见的编码类型,然后终于看到了我们的主角杨间,顺道了解了下面的知识,简单讲解一下😂

ASICII

这也是出的比较早的版本,包含基础的英文大小写、数字、特殊符号,对其他国家特有的文字却不支持

学过开发的应该都知道:4857数字、6590大写字母、97~122小写字母、其他特殊符号

ASICII对照表 就不拿出来的,太长了,一搜就是

GB2312

1980 年,中国发布了第一个汉字编码标准,也即 GB2312 ,全称 《信息交换用汉字编码字符集·基本集》,通常简称 GB ("国标"汉语拼音首字母), 共收录了 6763 个常用的汉字和字符,此标准于次年5月实施,它满足了日常 99% 汉字的使用需求

ps:也是是我看小说文本无法正常显示给我推荐的一种编码

GBK

由于有些汉字是在 GB2312 标准发布之后才简化的,还有一些人名、繁体字、日语和朝鲜语中的汉字也没有包括在内,所以,在 GB2312 的基础上添加了这部分字符,就形成了 GBK ,全称 《汉字内码扩展规范》,共收录了两万多个汉字和字符,它完全兼容 GB2312

GBK 于 1995 年发布,不过它只是 "技术规范指导性文件",并不属于国家标准

GB18030

GB18030 全称《信息技术 中文编码字符集》 ,共收录七万多个汉字和字符, 它在 GBK 的基础上增加了中日韩语中的汉字 和 少数名族的文字及字符,完全兼容 GB2312,基本兼容 GBK

GB18030 发布过两个版本,第一版于 2000 年发布,称为 GB18030-2000,第二版于 2005 年发布,称为 GB18030-2005

他们之间关系

ASICII、GB2312、GBK、GB18030 之间的关系实际上属于包含关系,也就是从左到右分别为对方子集

相关推荐
shining10 小时前
当拿到一个新服务器时所需准备工作
linux·程序员
CodeSheep18 小时前
同事偷偷给我介绍私活,说1万报酬全给我,结果甲方私下告诉我说,同事在当中白拿了2万,我觉得被耍了,媳妇却让我要知足,说我一点不亏
前端·后端·程序员
程序员鱼皮1 天前
又一个新项目开源,让 AI 帮你盯全网热点!
javascript·ai·程序员·编程·ai编程
loonggg2 天前
一个被99%程序员忽略的效率杀手:你每天盯着看的那块屏幕
程序员
程序员cxuan2 天前
为什么 Claude 要求实名认证?
人工智能·后端·程序员
得物技术2 天前
生成式召回在得物的落地技术分享与思考
算法·性能优化·程序员
JarvanMo2 天前
别拦我!我要在手机上继续写代码
程序员
SimonKing2 天前
AI大模型中转平台,无需科学上网就可以使用国外模型
java·后端·程序员
程序员cxuan2 天前
10 个贼爽的 workflow 工作流
后端·程序员·代码规范
舒一笑2 天前
一文讲透 Temporal:为什么大厂都在用它做 AI 与分布式系统的“流程大脑”?
后端·程序员·llm