在处理字节或字节流的时候,经常会用到char/unsigned char/string,那么他们之间有何异同呢。下面简要概括一下。
char和unsigned char的区别
- char的取值范围是-128-127,ASCII码的取值范围也是0-127。所以char天然适配ASCII,所以一般用char来存储文本字符。
- unsigned char的取值范围是0-255,一般用来存储单字节的16进制数据。超过127的16进制,是无法打印出来的。
- 对于一个固定的16进制数据,如0xFF(255),用unsigned char接收和用char接收,没什么区别。因为他俩都是一个字节,底层二进制存储都是一样的。只是显示结果不一样,一个-1,一个255。所以,在读写二进制文件时,用char[]和unsigned char[]接收字节流是没问题的。
char str[]和字符串string区别
- 用char[]存储图片文件等二进制数据时,没有问题。但不能直接使用字符串函数读写其中数据。比如,想遍历二进制字节数组,不能用strlen。因为char[]作为"C风格的字符串"时,无法正确使用含\0的二进制数据(因为 C 库函数会被\0截断,遇到\0就结束)。正确方式,是指定固定长度,直接读取。如for(int i=0;i<65535;i++),而不是for(int i=0;i<str.strlen();i++)
- C++中的string是对char[]的封装,相当于char[],但又解决了C函数遇到\0就截断的问题。所以在C++中,直接使用string接收文本或二进制数据,一点问题没有。即便同时接收文本和二进制数据,也没问题。比如发送图片二进制时,前面部分字节用文本表示、后面部分用二进制表示。接收方收到后,按先文本后二进制方式解析即可。
- 除了char[]和string外,直接用std::vector<char>存储二进制数据也是可以的,和string一样。