共用体 union：节省内存的特殊数据类型

在C++开发中，当需要处理"同一时刻仅使用一种数据类型"的场景时，结构体（struct）的内存占用会显得冗余------结构体的所有成员会占用独立内存空间，总内存为各成员内存之和。而共用体（union）作为一种特殊的聚合数据类型，能让多个不同类型的成员共享同一块内存空间，仅占用最大成员所需的内存大小，从而实现内存优化。前文我们已掌握结构体的定义、传递及内存特性，共用体可看作结构体的"内存优化版"，二者语法相似但内存布局逻辑完全不同。本文将从共用体的核心原理入手，拆解其定义、内存特性、使用场景及与结构体的差异，帮你精准掌握这种节省内存的特殊数据类型。

一、共用体的核心认知：为什么需要 union？

实际开发中，经常存在"多个数据类型互斥使用"的场景------同一内存空间在不同时刻仅存储一种类型的数据，无需为每种类型单独分配内存。例如：

存储设备信息：设备可能是键盘（存储按键编码int）、鼠标（存储坐标float）、打印机（存储状态字符串char[]），同一时刻仅需存储一种设备的数据；
解析二进制数据：一段二进制流可能是int、float或char类型，需根据场景按不同类型解析，无需同时存储所有类型；
嵌入式开发：内存资源稀缺的场景（如单片机），需最大化利用有限内存，避免冗余占用。

若使用结构体存储上述场景的数据，会浪费大量内存（未使用的成员仍占用空间）；而共用体通过"成员共享内存"的特性，仅保留最大成员的内存空间，大幅节省内存开销。关键关联：共用体的内存存储遵循内存四区模型，局部共用体存于栈区，动态分配的共用体（new union）存于堆区，全局/静态共用体存于全局/静态区，与结构体的内存分配规则一致。

二、共用体的定义与基本使用

C++中共用体的定义语法与结构体类似，均使用聚合类型语法，核心区别在于内存布局------结构体成员独立占用内存，共用体成员共享同一块内存。核心操作包括"定义共用体""声明变量""成员访问"三个环节。

1. 共用体的定义语法

共用体定义需使用union关键字，指定"共用体名称"和"成员列表"，成员列表可包含任意C++数据类型（基本类型、指针、结构体等），语法格式如下：

cpp 复制代码

#include <iostream>
#include <cstring>
using namespace std;

// 格式1：仅定义共用体类型，后续声明变量
union 共用体名称 {
    数据类型 成员1;
    数据类型 成员2;
    // ... 更多成员（共享同一块内存）
};

// 格式2：定义共用体类型的同时声明变量
union 共用体名称 {
    数据类型 成员1;
    数据类型 成员2;
} 变量名1, 变量名2; // 多个变量用逗号分隔

// 格式3：匿名共用体（无名称），仅能声明一次变量
union {
    数据类型 成员1;
    数据类型 成员2;
} 变量名; // 仅当前变量可用，无法复用类型

2. 共用体变量的声明与初始化

共用体类型定义后，可像普通数据类型一样声明变量，初始化时需注意：仅能初始化一个成员（因为所有成员共享内存，初始化多个成员会相互覆盖）。常用初始化方式包括"默认初始化""指定成员初始化"。

cpp 复制代码

#include <iostream>
#include <cstring>
using namespace std;

// 定义设备信息共用体（同一时刻仅存储一种设备数据）
union DeviceInfo {
    int keyCode;    // 键盘按键编码（4字节）
    float coordinate[2]; // 鼠标坐标（8字节）
    char status[16]; // 打印机状态（16字节）
};

int main() {
    // 方式1：指定成员初始化（C++11及以上支持，仅能初始化一个成员）
    DeviceInfo dev1 = {.keyCode = 65}; // 初始化键盘编码（A键）
    
    // 方式2：默认初始化（无显式赋值，成员值为随机值，需手动赋值一个成员）
    DeviceInfo dev2;
    dev2.coordinate[0] = 100.5f; // 赋值鼠标X坐标
    dev2.coordinate[1] = 200.8f; // 赋值鼠标Y坐标
    
    // 错误：不可同时初始化多个成员，后初始化的会覆盖前一个
    // DeviceInfo dev3 = {65, 100.5f}; 
    
    return 0;
}

关键提醒：共用体的大小由最大成员的大小决定，上述DeviceInfo共用体的大小为16字节（与status成员大小一致），而非4+8+16=28字节，体现了内存节省的核心特性。

3. 共用体成员的访问与覆盖特性

共用体成员的访问方式与结构体完全一致，通过"点运算符（.）"访问普通变量成员，"箭头运算符（->）"访问指针变量成员。但需注意核心特性：修改任意一个成员会覆盖其他成员的值（所有成员共享同一块内存）。

cpp 复制代码

#include <iostream>
#include <cstring>
using namespace std;

union DeviceInfo {
    int keyCode;    // 4字节
    float coordinate[2]; // 8字节
    char status[16]; // 16字节
};

int main() {
    DeviceInfo dev;
    // 赋值第一个成员
    dev.keyCode = 65; // 存储A键编码
    cout << "keyCode：" << dev.keyCode << endl; // 输出65
    
    // 赋值第二个成员，覆盖keyCode的值
    dev.coordinate[0] = 100.5f;
    cout << "覆盖后keyCode：" << dev.keyCode << endl; // 输出随机值（内存被覆盖）
    cout << "coordinate[0]：" << dev.coordinate[0] << endl; // 输出100.5f
    
    // 赋值第三个成员，覆盖coordinate的值
    strcpy(dev.status, "打印中");
    cout << "覆盖后coordinate[0]：" << dev.coordinate[0] << endl; // 随机值
    cout << "status：" << dev.status << endl; // 输出"打印中"
    
    // 共用体大小 = 最大成员大小（16字节）
    cout << "共用体大小：" << sizeof(DeviceInfo) << "字节" << endl;
    return 0;
}

运行结果分析：每次赋值新成员都会覆盖原有成员的内存数据，因此共用体仅适用于"同一时刻仅使用一个成员"的场景，这是与结构体最核心的区别。

4. 共用体的嵌套使用

共用体支持嵌套定义，即一个共用体的成员可以是另一个共用体或结构体类型，用于描述更复杂的互斥数据场景。例如，嵌套结构体实现更精细的数据分类。

cpp 复制代码

#include <iostream>
#include <cstring>
using namespace std;

// 定义鼠标坐标结构体
struct MousePos {
    float x;
    float y;
};

// 嵌套共用体：设备信息包含不同类型的互斥数据
union DeviceInfo {
    int keyCode;    // 键盘编码
    MousePos pos;   // 鼠标坐标（结构体成员）
    char status[16]; // 打印机状态
};

int main() {
    DeviceInfo dev;
    // 赋值嵌套的结构体成员
    dev.pos.x = 150.2f;
    dev.pos.y = 250.7f;
    cout << "鼠标坐标：(" << dev.pos.x << "," << dev.pos.y << ")" << endl;
    
    // 覆盖为键盘编码
    dev.keyCode = 66;
    cout << "键盘编码：" << dev.keyCode << endl;
    cout << "覆盖后鼠标X坐标：" << dev.pos.x << endl; // 随机值（被覆盖）
    
    return 0;
}

三、共用体的内存布局原理

理解共用体的内存布局是掌握其核心特性的关键，共用体的所有成员从同一内存地址开始存储，内存大小等于最大成员的大小（若存在内存对齐需求，会按对齐规则扩展大小）。

1. 基本内存布局

以如下共用体为例，分析其内存布局：

cpp 复制代码

union TestUnion {
    char c;   // 1字节
    int i;    // 4字节
    float f;  // 4字节
};

// 共用体大小为4字节（最大成员i和f的大小）
cout << sizeof(TestUnion) << "字节" << endl; // 输出4

内存布局示意图（地址从低到高）：

成员c占用地址0x00（1字节）；
成员i占用地址0x00-0x03（4字节），覆盖c的内存；
成员f占用地址0x00-0x03（4字节），与i共享同一内存区间。

因此，修改c的值会影响i和f的低字节数据，修改i或f的值会完全覆盖c的值。

2. 内存对齐影响

与结构体类似，共用体也会遵循内存对齐规则（为提升访问效率，成员地址需是自身大小的整数倍），若最大成员大小不满足对齐要求，共用体大小会按对齐单位扩展。

cpp 复制代码

// 内存对齐示例：成员double占8字节，对齐单位为8
union AlignUnion {
    char c;     // 1字节
    double d;   // 8字节
};

// 共用体大小为8字节（按double的对齐单位扩展）
cout << sizeof(AlignUnion) << "字节" << endl; // 输出8

关键提醒：内存对齐是编译器的优化行为，不同编译器的对齐规则可能略有差异，核心是确保最大成员能正常存储和访问。

四、共用体与结构体的核心差异对比

共用体与结构体语法相似，均为聚合数据类型，但内存布局、使用场景完全不同，以下从核心特性、内存占用、成员关系、适用场景四个维度对比，帮你精准区分。

对比维度	共用体（union）	结构体（struct）
核心特性	所有成员共享同一块内存空间	每个成员占用独立内存空间
内存占用	等于最大成员大小（含对齐扩展）	所有成员大小之和（含对齐扩展）
成员关系	互斥关系，修改一个成员覆盖其他成员	独立关系，修改一个成员不影响其他成员
初始化规则	仅能初始化一个成员	可初始化所有成员（顺序或指定成员）
适用场景	同一时刻仅使用一种数据类型，需节省内存	同时使用多种数据类型，描述复杂对象
实战选型建议：需同时存储多个属性（如学生的姓名、年龄、成绩）用结构体；需互斥存储多种属性（如设备的不同类型数据）用共用体，必要时可嵌套使用（结构体作为共用体成员）。

五、共用体的典型使用场景

共用体的核心价值是内存优化，适用于"数据互斥"的场景，以下是两个典型实战场景，帮你理解其实际应用。

场景1：解析二进制数据（类型互斥）

在网络传输、文件解析等场景中，一段二进制数据可能对应不同的数据类型，共用体可快速实现不同类型的解析，无需额外分配内存。

cpp 复制代码

#include <iostream>
using namespace std;

// 共用体解析4字节二进制数据
union BinaryParser {
    int intVal;    // 按int解析（4字节）
    float floatVal;// 按float解析（4字节）
    char byteVal[4];// 按字节数组解析（4字节）
};

int main() {
    BinaryParser parser;
    // 按int赋值
    parser.intVal = 0x12345678;
    
    // 按字节数组解析（查看每个字节的内容）
    cout << "字节解析：";
    for (int i = 0; i < 4; i++) {
        cout << hex << (int)(unsigned char)parser.byteVal[i] << " ";
    }
    cout << endl;
    
    // 按float解析（不同类型的二进制编码不同，结果为对应float值）
    cout << "float解析：" << parser.floatVal << endl;
    
    return 0;
}

场景2：嵌入式开发中的内存优化

嵌入式设备（如单片机）内存资源有限（通常几KB到几十KB），共用体可大幅节省内存。例如，存储传感器数据，同一时刻仅采集一种传感器的数据。

cpp 复制代码

#include <iostream>
using namespace std;

// 传感器数据共用体（内存优化）
union SensorData {
    int temp;     // 温度（整数型，4字节）
    float humidity;// 湿度（浮点型，4字节）
    long light;   // 光照强度（长整型，4字节）
};

int main() {
    SensorData data;
    // 采集温度数据
    data.temp = 25;
    cout << "温度：" << data.temp << "℃" << endl;
    
    // 采集湿度数据（覆盖温度）
    data.humidity = 65.5f;
    cout << "湿度：" << data.humidity << "%" << endl;
    
    // 共用体大小仅4字节，节省内存
    cout << "传感器数据占用内存：" << sizeof(SensorData) << "字节" << endl;
    return 0;
}

六、常见问题与避坑指南

1. 误用共用体存储非互斥数据

若试图同时使用共用体的多个成员，会因内存覆盖导致数据错误。规避方案：明确共用体的"互斥使用"核心，仅在同一时刻操作一个成员，必要时通过标志位记录当前使用的成员类型。

cpp 复制代码

// 优化方案：用结构体包裹共用体+标志位，记录当前成员类型
struct DataWrapper {
    enum Type { KEYBOARD, MOUSE, PRINTER } type; // 标志位
    union DeviceInfo {
        int keyCode;
        float coordinate[2];
        char status[16];
    } info;
};

// 使用时先判断类型，再操作对应成员
DataWrapper dev;
dev.type = DataWrapper::MOUSE;
dev.info.coordinate[0] = 100.5f;

2. 忽略内存对齐导致的大小计算错误

共用体大小并非单纯等于最大成员大小，需考虑内存对齐。规避方案：使用sizeof运算符计算实际大小，避免手动估算；必要时通过编译器指令调整对齐规则（如#pragma pack）。

3. 共用体成员包含堆区指针的风险

若共用体成员包含堆区指针（如char*），需注意仅能由一个成员管理堆内存，避免重复释放或野指针。规避方案：优先使用固定大小数组替代堆区指针；若必须使用，需严格控制指针的生命周期，确保仅释放一次。

4. 跨编译器的兼容性问题

不同编译器的内存对齐规则、字节序（大端/小端）可能不同，共用体解析二进制数据时可能出现差异。规避方案：明确指定对齐规则，解析二进制数据时考虑字节序转换，确保跨编译器兼容。

七、总结

共用体（union）是C++中用于内存优化的特殊聚合数据类型，核心特性是"多成员共享同一块内存空间"，仅占用最大成员所需的内存大小，完美适配"同一时刻仅使用一种数据类型"的场景。与结构体相比，共用体牺牲了成员的独立性，换取了内存占用的最小化，二者互补，共同覆盖复杂数据的存储需求。

掌握共用体的核心要点：明确其"成员互斥、内存共享"的本质，熟练定义、初始化及访问成员，理解内存布局与对齐规则，结合场景精准选型（互斥数据用共用体，共存数据用结构体）。共用体在二进制解析、嵌入式开发、内存稀缺场景中具有不可替代的作用，是提升代码内存效率的重要工具。