10乱码问题的解释(1)

在计算机中,一个汉字,占几个字节?

针对这个问题,只要你回答出一个具体的数字,就一定是错的!!
前提条件: 当前中文编码使用的是哪种方式(字符集)

计算机存的其实是二进制数字~~
英文字母 ,怎么表示的?? ASCII 码表~~ 规定了每个字符,都有一个对应的数字来表示~~

只是表示英文,一个字节足够了~~ 毕竟英文字母数目非常有限~~

中文中一共多少个汉字呢?

日常的常用字,大概是 4k 多个
算上各种生僻字,总数差不多 6w 左右~~

对于计算机来说,6w 多个符号的表格

就是小 case ~~

仍然使用一个大表格,给每个汉字,分配一个整数即可~~

具体这个表格,是啥样子?

具体每个汉字,都使用哪个数字表示??

这个事情就不一定了!!

字符集~~ 表示汉字的字符集, 其实是有很多种的!!!
不同的字符集,表示同一个汉字,使用的数字不相同!!

目前,表示汉字字符集,主要是两种方式

1.GBK.(中国大陆) 使用 2 个字节表示一个汉字

Windows 简体中文版默认的字符集就是 GBK

  1. UTF-8 / utf8

变长编码.表示一个符号,使用的字节数有变化,2-4

但是在 utf8 中,一个汉字,一般是 3 个字节

Linux 默认就是 utf8

一个汉字,具体的 utf8/gbk 编码的数值是多少,可以通过一些在线工具来查看~~

编码工具

size_t strlen ( const char * str );
size_t 的大小取决于具体的平台和编译器。通常:

  • 32位系统 上,size_t 一般是 4 字节(32位)。---"%d"

  • 64位系统 上,size_t 一般是 8 字节(64位)。---"%ld"

相关推荐
karatttt4 分钟前
用go从零构建写一个RPC(仿gRPC,tRPC)--- 版本1
后端·qt·rpc·架构·golang
清醒的兰4 小时前
Qt 调试信息重定向到本地文件
开发语言·qt
AI+程序员在路上5 小时前
QT跨平台软件开发要点
开发语言·qt
道剑剑非道6 小时前
QT开发技术【QT实现桌面右下角消息】
开发语言·数据库·qt
此刻我在家里喂猪呢7 小时前
qt之开发大恒usb3.0相机一
qt·相机开发·大恒usb3.0相机·工业相机开发
xMathematics12 小时前
计算机图形学实践:结合Qt和OpenGL实现绘制彩色三角形
开发语言·c++·qt·计算机图形学·cmake·opengl
星火撩猿14 小时前
ubantu中下载编译安装qt5.15.3
开发语言·qt
机器视觉知识推荐、就业指导17 小时前
开源QML控件:进度条滑动控件(含源码下载链接)
前端·qt·开源·qml
꧁坚持很酷꧂21 小时前
Linux Ubuntu18.04下安装Qt Craeator 5.12.9(图文详解)
linux·运维·qt
ChoSeitaku21 小时前
17.QT-Qt窗口-工具栏|状态栏|浮动窗口|设置停靠位置|设置浮动属性|设置移动属性|拉伸系数|添加控件(C++)
c++·qt·命令模式