【C语言】探讨常见自定义类型的存储形式

🚩纸上得来终觉浅, 绝知此事要躬行。

🌟主页:June-Frost

🚀专栏:C语言
🔥该文章将探讨结构体,位段,共用体的存储形式。

目录:

🌍结构体内存对齐

结构体(struct)是一种用于存储一组不同类型数据的复合数据类型。为了提高内存访问效率,许多计算机系统对结构体进行内存对齐。内存对齐是一种优化内存访问效率的方式,通过将数据存储在特定的内存地址上,使得CPU的内存访问速度更快。对于一些特定的硬件平台和体系结构,内存对齐的要求是必需的。为了更好的理解,我们可以通过计算结构体的大小引入。

c 复制代码
struct S1
{
	char c1;
	int i;
	char c2;
};
//大小为12
c 复制代码
struct S2
{
	int i;
	char c1;
	char c2;
};
//大小为8
c 复制代码
struct S3
{
	char c3;
	struct S1;
	char c4;
};
//大小为20

通过offsetof计算一下结构体(S1)成员相较于结构体起始位置的偏移量,发现分别是0,4,8 。

这也就意味着S1在内存中的分布是这样的:

通过上面的现象分析,可以发现结构成员不是按照顺序在内存中连续存放的,而是有一定的对齐规则。

📙结构体内存对齐的规则:

  1. 第一个成员永远存放在与结构体变量偏移量为0的地址处。
  2. 从第二个成员开始,往后的每个成员都要对齐到某个对齐数的整数倍处。

对齐数:结构体成员自身的大小和默认对齐数的较小值。
VS 上默认对齐数是8。
gcc上没有默认对齐数,对齐数就是结构体成员自身的大小。

  1. 结构体的总大小,必须是最大对齐数的整数倍。

最大对齐数:所有成员的对齐数中最大的值。

  1. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处。

🔭为什么会有内存对齐呢?

1.平台原因(移植原因):

不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。

2.性能原因:

数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

总的来说,结构体的内存对齐是拿空间来换取时间的做法。

所以我们在设计结构体的时候,既要满足对齐,又要节省空间:让占用空间小的成员尽量集中在一起。

c 复制代码
struct S1
{
	char c1;
	int i;
	char c2;
};

struct S2
{
	int i;
	char c1;
	char c2;
};

这两个结构体的成员一摸一样,但是S1需要12个字节,而S2只需要8个字节。

✉️修改默认对齐数

通过 #pragma 这个预处理指令,就可以改变默认对齐数。

例如:

c 复制代码
#include<stdio.h>
#pragma pack(1)//设置默认对齐数为1
struct S1
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
	printf("%zd", sizeof(struct S1));//结果为6
	return 0;
}

🌎 位段

位段是 C 语言中的一种数据类型,用于将一组数值存储到计算机内存中的二进制位中。位段通常用于在内存节省空间的同时,以一种可读性较高的方式存储多个二进制标志或数据。每个位段可以指定其所占用的二进制位数。

⚠注意:

  1. 位段的成员可以是 int ,unsigned int ,signed int 或者是 char (属于整形家族)类型。
  2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
  3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

由于位段不跨平台,所以在此浅谈一下VS的位段存储。

c 复制代码
#include<stdio.h>
struct S 
{
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};
int main()
{
	struct S s = { 0 };
	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;
	printf("%d", sizeof(s));
	return 0;
}


事实确实如此:

位段在网络底层非常有用,例如:IP数据包的格式。


🌏联合

联合体(union)是一种特殊的数据类型,它允许在内存中创建多个变量,但只能存储其中一个变量的值。联合体的目的是节省内存空间,因为它可以重复利用同一块内存存储不同的变量值。

⚠规则:

  1. 联合的大小至少是最大成员的大小。
  2. 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
c 复制代码
union Un
{
	char c[5];//对齐数是1
	int i;//对齐数是4
};
//最大对齐数是4
//大小为8字节

char c[5] 的大小为5字节,int i 的大小为4字节,所以至少为5个字节,但是这里最大对齐数是4,所以总大小会增加至 8个字节。


❤️ 结语

文章到这里就结束了,如果对你有帮助,你的点赞将会是我的最大动力,如果大家有什么问题或者不同的见解,欢迎大家的留言~

相关推荐
☆璇7 分钟前
【数据结构】顺序表和链表经典题目
c语言·数据结构·链表
¥ 多多¥8 分钟前
数据结构:单链表实现信息管理
c语言·数据结构·算法
z_鑫22 分钟前
C语言:冒泡排序的注意事项及具体实现
c语言·开发语言·数据结构·算法
小容小容1 小时前
认识结构体
c语言
码力码力我爱你3 小时前
C HTML格式解析与生成之gumbo
c语言·开发语言·html
DdddJMs__1353 小时前
C语言 | Leetcode C语言题解之第421题数组中两个数的最大异或值
c语言·leetcode·题解
安亿1034 小时前
linux下的日志编写
linux·服务器·c语言·软件构建
咩咩大主教4 小时前
C++在Linux实现多线程和多进程的TCP服务器和客户端通信
linux·服务器·c语言·开发语言·c++·网络协议·tcp/ip
YuCaiH6 小时前
【C语言-数据结构】单链表的定义
c语言·数据结构·笔记
Che3rry6 小时前
C/C++|关于多线程冲突
java·c语言·c++