ASICII、CG2312、GBK、GB18030

前言

平时我们会碰到一些字符编码的问题,比如我去年看一篇小说神秘复苏的时候,给我提示编码不正确,显示的全是乱码,然后我了解了一些目前比较常见的编码类型,然后终于看到了我们的主角杨间,顺道了解了下面的知识,简单讲解一下😂

ASICII

这也是出的比较早的版本,包含基础的英文大小写、数字、特殊符号,对其他国家特有的文字却不支持

学过开发的应该都知道:4857数字、6590大写字母、97~122小写字母、其他特殊符号

ASICII对照表 就不拿出来的,太长了,一搜就是

GB2312

1980 年,中国发布了第一个汉字编码标准,也即 GB2312 ,全称 《信息交换用汉字编码字符集·基本集》,通常简称 GB ("国标"汉语拼音首字母), 共收录了 6763 个常用的汉字和字符,此标准于次年5月实施,它满足了日常 99% 汉字的使用需求

ps:也是是我看小说文本无法正常显示给我推荐的一种编码

GBK

由于有些汉字是在 GB2312 标准发布之后才简化的,还有一些人名、繁体字、日语和朝鲜语中的汉字也没有包括在内,所以,在 GB2312 的基础上添加了这部分字符,就形成了 GBK ,全称 《汉字内码扩展规范》,共收录了两万多个汉字和字符,它完全兼容 GB2312

GBK 于 1995 年发布,不过它只是 "技术规范指导性文件",并不属于国家标准

GB18030

GB18030 全称《信息技术 中文编码字符集》 ,共收录七万多个汉字和字符, 它在 GBK 的基础上增加了中日韩语中的汉字 和 少数名族的文字及字符,完全兼容 GB2312,基本兼容 GBK

GB18030 发布过两个版本,第一版于 2000 年发布,称为 GB18030-2000,第二版于 2005 年发布,称为 GB18030-2005

他们之间关系

ASICII、GB2312、GBK、GB18030 之间的关系实际上属于包含关系,也就是从左到右分别为对方子集

相关推荐
autumnTop40 分钟前
为什么访问不了同事的服务器或者ping不通地址了?
前端·后端·程序员
AI大模型2 小时前
从零开始,亲手开发你的第一个AI大模型(一)基础知识
程序员·langchain·agent
SimonKing2 小时前
Mybatis批量插入,形式不同性能也不同
数据库·后端·程序员
阿杆3 小时前
我被字节白嫖了……
程序员·掘金社区·trae
袁煦丞3 小时前
2025.8.18实验室【代码跑酷指南】Jupyter Notebook程序员的魔法本:cpolar内网穿透实验室第622个成功挑战
前端·程序员·远程工作
CodeSheep4 小时前
Stack Overflow,轰然倒下了!
前端·后端·程序员
KirkLin19 小时前
Kirk:练习时长两年半的AI Coding经验
人工智能·程序员·全栈
挽淚19 小时前
(小白向)什么是Prompt,RAG,Agent,Function Calling和MCP ?
人工智能·程序员
MrSYJ1 天前
全局和局部AuthenticationManager
java·后端·程序员