在C语言中,共用体[还有一种称呼是联合体](union)是一种特殊的数据结构,其所有成员共享同一块内存空间,这一特性使其在内存优化和底层编程中极具实用价值。本文将通过三组实战代码,拆解共用体的内存大小计算与大小端字节序判断两大核心应用,帮你彻底搞懂共用体的底层逻辑。
一、共用体的内存大小计算:为什么不是成员大小之和?
首先看第一组代码,核心是探究共用体的 sizeof 结果:
union Un
{
char a[5]; // 字符数组,占5字节
int b; // 整型,占4字节
};
int main()
{
union Un un = { 0 };
printf("%d\n", sizeof(un)); // 输出结果是多少?
return 0;
}
关键结论:
共用体的内存大小遵循两个规则:
-
最大成员对齐规则:大小为"最大成员大小"的整数倍(满足内存对齐要求);
-
共享内存规则:所有成员共用一块内存,大小不会累加。
这里最大成员是 char a[5] (5字节),但内存对齐要求需是 int (4字节)的整数倍,因此最小满足条件的是8字节,最终 sizeof(un) 输出8。
二、大小端字节序:计算机存储数据的"顺序密码"
在讲解第二、三组代码前,先明确大小端的核心概念:
-
大端字节序:数据的高位字节存低地址,低位字节存高地址(如 0x11223344 , 0x11 存低地址);
-
小端字节序:数据的低位字节存低地址,高位字节存高地址(如 0x11223344 , 0x44 存低地址)。
日常使用的x86架构CPU多为小端,而嵌入式、网络传输中常涉及大端,因此需要通过代码判断当前环境的字节序。
三、两种大小端判断方案:数组法vs共用体法
方案1:整型+字符指针(数组思想)
int reck() // 1为大端,0为小端
{
int a = 0x11223344; // 4字节整型,二进制高位到低位:11 22 33 44
char* p = (char*)&a; // char*仅访问1字节,指向a的低地址
if (*p == 0x11) // 若低地址存高位0x11 → 大端
return 1;
else // 若低地址存低位0x44 → 小端
return 0;
}
int main()
{
printf("当前是%s端\n", reck() ? "大" : "小");
return 0;
}
方案2:共用体法(利用共享内存特性)
union Un
{
char b; // 1字节,共享int的低地址
int a; // 4字节,覆盖整个共用体内存
};
int reck() // 1为大端,0为小端
{
union Un un;
un.a = 0x11223344; // 给int赋值,覆盖共用体内存
char* p = &un.b; // 指向共用体低地址(即char b的地址)
return (*p == 0x11) ? 1 : 0; // 判断低地址存储的字节
}
int main()
{
printf("当前是%s端\n", reck() ? "大" : "小");
return 0;
}
两种方案对比:
-
数组法:逻辑直接,无需借助共用体,适合入门理解;
-
共用体法:更贴合底层内存设计,利用"成员共享内存"特性,代码更简洁,是工业级常用方案。
注意:代码易错点修正
原代码中 if (*p = 0x11) 是赋值操作( = ),而非判断( == ),会导致结果始终为1,实际开发中需务必修正为判断运算符 == !
四、核心总结
-
共用体大小 = 最大成员大小的整数倍(内存对齐);
-
大小端判断的核心:通过"访问低地址1字节数据",判断其是原数据的高位还是低位;
-
共用体是底层编程的"利器",除了大小端判断,还可用于内存复用、硬件寄存器操作等场景。