ASICII、CG2312、GBK、GB18030

前言

平时我们会碰到一些字符编码的问题,比如我去年看一篇小说神秘复苏的时候,给我提示编码不正确,显示的全是乱码,然后我了解了一些目前比较常见的编码类型,然后终于看到了我们的主角杨间,顺道了解了下面的知识,简单讲解一下😂

ASICII

这也是出的比较早的版本,包含基础的英文大小写、数字、特殊符号,对其他国家特有的文字却不支持

学过开发的应该都知道:4857数字、6590大写字母、97~122小写字母、其他特殊符号

ASICII对照表 就不拿出来的,太长了,一搜就是

GB2312

1980 年,中国发布了第一个汉字编码标准,也即 GB2312 ,全称 《信息交换用汉字编码字符集·基本集》,通常简称 GB ("国标"汉语拼音首字母), 共收录了 6763 个常用的汉字和字符,此标准于次年5月实施,它满足了日常 99% 汉字的使用需求

ps:也是是我看小说文本无法正常显示给我推荐的一种编码

GBK

由于有些汉字是在 GB2312 标准发布之后才简化的,还有一些人名、繁体字、日语和朝鲜语中的汉字也没有包括在内,所以,在 GB2312 的基础上添加了这部分字符,就形成了 GBK ,全称 《汉字内码扩展规范》,共收录了两万多个汉字和字符,它完全兼容 GB2312

GBK 于 1995 年发布,不过它只是 "技术规范指导性文件",并不属于国家标准

GB18030

GB18030 全称《信息技术 中文编码字符集》 ,共收录七万多个汉字和字符, 它在 GBK 的基础上增加了中日韩语中的汉字 和 少数名族的文字及字符,完全兼容 GB2312,基本兼容 GBK

GB18030 发布过两个版本,第一版于 2000 年发布,称为 GB18030-2000,第二版于 2005 年发布,称为 GB18030-2005

他们之间关系

ASICII、GB2312、GBK、GB18030 之间的关系实际上属于包含关系,也就是从左到右分别为对方子集

相关推荐
DogDaoDao6 分钟前
Windows 下 Git 报错:`touch` 无法识别 —— 原因分析与 7 种解决方案(从入门到精通)
windows·git·程序员·npm·powershell·cmd·touch
小孔龙41 分钟前
Android `<activity-alias>` 指南:动态图标 · 多入口 · 重命名兼容
android·程序员·掘金·日新计划
彩票管理中心秘书长42 分钟前
智能体状态指示:何时思考、何时调用工具、何时出错
前端·后端·程序员
彩票管理中心秘书长42 分钟前
React + TypeScript拆解一整套“AI 变现代码流程”
前端·后端·程序员
AskHarries1 小时前
OpenClaw 是什么?为什么它不是普通 AI Agent
人工智能·后端·程序员
AskHarries1 小时前
如何判断一个需求是真需求
人工智能·程序员·产品
SimonKing3 小时前
IP定位库的完美替代品:ip2region,开源、免费!
java·后端·程序员
修己xj15 小时前
“杀!杀!杀!”、“我最讨厌事后道歉”——骂“杀哥”之前,谁还没当过情绪崩溃的人
程序员
Patrick_Wilson16 小时前
知识沉淀的四层模型:从个人笔记到企业资产,让文档真正长出复利
面试·程序员·ai编程
阿凡98073018 小时前
花 100 dollar,用 Claude 打通 EasyEDA&Fusion 双向同步
后端·程序员