大小端字节序(Endianness)是指多字节数据(如整数、浮点数等)在计算机内存中的存储序。主要有两种类型的大小端字节序:大端(Big-endian)和小端(Little-endian)。
4.6.1 大端字节序(Big-endian)
在大端字节序中,多字节数据的最高有效字节(MSB)存储在最低的内存地址处,而最低有效字节(LSB)存储在最高的内存地址处。这种字节序有时被称为"网络字节序",因为它是网络协议中用的标准字节序。
例如:假设有一个16位的的数据
内存地址 数据
0x00 0x12
0x01 0x34
4.6.2 小端字节序(Little-endian)
在小端字节序中,多字节数据的最低有效字节(LSB)存储在最低的内存地址处,而最高有效字(MSB)存储在最高的内存地址处。
使用同样的16位整数 0x1234 ,在小端字节序中的存储方式如下:
内存地址 数据
0x00 0x34
0x01 0x12
4.6.3 大小端字节序的影响
大小端字节序的不同会导致相同的数据在不同的计算机架构之间传输时需要进行字节序转换如,如
果一个在大端字节序计算机上创建的文件被传输到小端字节序计算机上,那么文件中的多字节数据需要被正确解释。
4.6.4 如何检测大小端
在C语言中,可以通过一个简单的宏来检测系统的字节序:
cs
#include <stdio.h>
// 定义变量存储1,用于获取可寻址的内存
static const int check_endian = 1;
// 修正宏:通过变量的地址来检测字节序
#define IS_BIG_ENDIAN ((unsigned char)1 == ((unsigned char *)&check_endian)[sizeof(int) - 1])
#define IS_LITTLE_ENDIAN ((unsigned char)1 == ((unsigned char *)&check_endian)[0])
int main() {
if (IS_LITTLE_ENDIAN) {
printf("System is Little-Endian (小端模式).\n");
} else if (IS_BIG_ENDIAN) {
printf("System is Big-Endian (大端模式).\n");
} else {
printf("System is of unknown endianness.\n");
}
return 0;
}
注意:在对数据进行取地址的时候必须是定义这个变量进行初始化,否者编译器在编译的时候会报错的
案例2:
cs
#include <stdio.h>
// 定义一个结构体,其中包含一个char成员和一个int成员
typedef struct {
char c; // 1字节
int i; // 4字节(大多数现代系统)
} CheckEndian;
int main() {
CheckEndian check;
check.c = 1; // 将char成员设置为1,即内存中的最低有效字节为1
// 根据int成员的值来判断字节序
if (*(unsigned char *)&check.i == 1) {
printf("Little-endian system.\n");
} else {
printf("Big-endian system.\n");
}
return 0;
}
处理的思维是一样的,只是通过结构体来访问结构体的成员变量而已。