结构体（C语言）

"点赞，留言，收藏，关注"

就是对阿林最大的支持

1.自定义类型

什么是自定义类型？C语言中有一些自带的数据类型，比如说char，int，float，double，long等数据类型就是C语言的内置类型

在生活中，要描述一件东西，往往有很多的参数，只是靠内置类型就显得数据零散，或者说不太够用，所以C语言除了内置类型之外又有了自定义类型，结构体、联合体便是自定义类型

2.结构体

结构体定义是由关键字 struct 和结构体名组成，结构体名可以根据需要自行定义。struct 语句定义了一个包含多个成员的新的数据类型，struct 语句的格式如下：

struct tag //结构体类型

{

member-list //结构体成员

member-list ... //结构体成员

} variable-list ；

tag是结构体标签，定义结构体类型，如book，student等
member-list 是标准的变量定义，比如 int i; 或者 float f;，也可以定义数组char s $20$
variable-list结构变量，定义在结构的末尾，最后一个分号之前，表示全局的结构体，可以指定一个或多个结构变量，也可省略

给出一个简单的结构的例子：

2.1普通结构体

struct student //假设这是一个学生信息的结构体

{

int age; //年龄

char name $20$ ; //名字

char ID $25$ ; //学号

char sex $6$ ; //性别

};

int main()

{

struct student zhangsan = { .age = 18, .ID = "12023", .sex = "男", .name = "张三" };

return 0;

}

2.2嵌套结构体

和函数一样，结构体也可以嵌套使用，也就是在一个结构体中使用另外一个结构体，也可以包含指向自己结构体类型的指针 ，而通常这种指针的应用是为了实现一些更高级的数据结构如链表等。

struct student

{

int age; //年龄

char sex $6$ ; //性别

int weight; //体重

};

struct people

{

int num; //序号

struct student s; //学生s

};

2.3匿名结构体

如下：

struct//匿名结构体

{

int num;

char name $20$ ;

};

struct

{

int a;

char b;

float c;

}x;

struct

{

int a;

char b;

float c;

}*p;

p = &x; //两种结构体不同无法赋值

匿名结构体是不定义结构体名称，直接定义其成员，这种结构体只能使用一次。并且两个匿名结构体的成员如果都相同的话，这两个匿名结构体也是不同的

注意：匿名结构体在程序中只能使用一次

2.4typedef重命名结构体

结构体名称在使用时，类型和名称较长，这时我们就可以使用typedef来简化

写法如下：

typedef struct student

{

int age;

char sex $6$ ;

int weight;

}stu;

//这样写完后，可以用stu代替struct student

但是需要注意的是：不能在重命名前使用重命名后的结构体

typedef struct student

{

int age;

char sex $8$ ;

int weight;

char tele $20$ ;

stu* next; //这里使用了重命名后的结构体

}stu； //实际上代码走到这里才知道结构体重命名为stu

2.5结构体的访问

struct student //假设这是一个学生信息的结构体

{

int age; //年龄

char name $20$ ; //名字

char ID $25$ ; //学号

char sex $6$ ; //性别

};

int main()

{

struct student zhangsan = { .age = 18, .ID = "12023", .sex = "男", .name = "张三" };

//这里使用了" . 成员名"进行访问

return 0;

}

2.6结构体对齐

既然一个结构体里面有多个变量，那他们是怎么存储的呢？一个结构体的大小是多少呢？

struct example

{

int num;

char a;

float b;

int p;

}s;

int main()

{

size_t sz = sizeof(s);

printf("大小为%zd\n", sz);

return 0;

}

按照我们的直觉，int是4个字节，char是1个字节，float是4个字节

全部加起来是 13个字节

实际上运行结果（VS2022）：

16

其实我们之前一直学的都是，数据在内存中连续存储，，而C语言存在内存对齐

内存对齐规则：

》结构体的第⼀个成员对⻬到和结构体变量起始位置偏移量为0的地址处

》其他成员变量要对⻬到某个数字（对⻬数）的整数倍的地址处

》对⻬数 = 编译器默认的⼀个对⻬数与该成员变量⼤⼩的较⼩值。(VS 中默认的值为 8 ， Linux中gcc没有默认对齐数，对⻬数就是成员⾃⾝的⼤⼩)

》结构体总⼤⼩为最⼤对⻬数（结构体中每个成员变量都有⼀个对⻬数，所有对⻬数中最⼤的）的整数倍

》如果嵌套了结构体的情况，嵌套的结构体成员对⻬到⾃⼰的成员中最⼤对⻬数的整数倍处结构体的整体⼤⼩就是所有最⼤对⻬数（含嵌套结构体中成员的对⻬数）的整数倍

为什么要内存对齐呢？

》平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常

》性能原因：数据结构(尤其是栈)应该尽可能地在⾃然边界上对⻬。原因在于，为了访问未对⻬的内存，处理器需要作两次内存访问；⽽对⻬的内存访问仅需要⼀次访问。假设⼀个处理器总是从内存中取8个字节，则地址必须是8的倍数。如果我们能保证将所有的double 类型的数据的地址都对⻬成8的倍数，那么就可以⽤⼀个内存操作来读或者写值了。否则，我们可能需要执⾏两次内存访问，因为对象可能被分放在两个8字节内存块中

用例子说明内存对齐：

#include<stddef.h>

struct Stu

{

char ch;

int i;

char ch2;

};

int main()

{

return 0;

}

左侧数字是偏移量，上图可描述结构体的内存对齐

未填充颜色的区域，表示未使用的内存，说明内存被浪费了

》c1是一个char类型占一个字节，根据内存对齐第一条规则，放在偏移量为0处

》i是int类型占四个字节，根据内存对齐第二，三规则，默认对齐数是4，对齐至4的整数倍，中间浪费三个字节，偏移量为4

》c2也是char类型占一个字节，默认对齐数是1的整数倍，偏移量为8

用一个实例验证：

#include<stdio.h>

struct stu

{

char ch;

int a;

int b;

};

int main()

{

printf("%zd\n", sizeof(struct stu));

return 0;

}

根据结构体的对齐规则，

char类型的ch放在偏移量为0的位置

int类型的a对齐数是4，放在偏移量4-7的位置，与上一个数据间隔了3个字节

int类型的b对齐数是4，放在偏移量8-11的位置

整个结构体占用的内存应该是4的整数倍，能存下最小内存是12个字节

VS2022运行结果： 12

2.7修改默认对齐数

既然对齐数被c语言默认了，我们能不能自行更改呢？答案是可以的

#pragma 这个预处理指令，我们可以通过它来改变编译器的默认对⻬数

#include <stdio.h>

#pragma pack(1)

struct Stu

{

char ch;

int i;

char ch2;

};

#pragma pack()

int main()

{

printf("大小为%d\n", sizeof(struct Stu));

return 0;

}

我们可以看到，使用了两次pragma

因为使用#pragma（1）修改对齐数后，便会以这个对齐数向下执行，需要及时恢复为默认对齐数，以免对后续代码造成影响

运行结果：6

因为对齐数是1，结构体数据在内存中是连续存储的，就等于各成员占用空间之和

2.8位段

什么是位段？

有些数据在存储时并不需要占用一个完整的字节，只需要占用一个或几个二进制位即可，所以C 语言有一种特别的数据结构名为位段，允许我们按位对成员进行定义，指定占用的位数 ，单位为比特位(bit)。一般是用来节约内存，与结构体有两个不同

》位段的成员必须是 int、unsigned int 或signed int ，char等整型。到了 C99，_Bool 也被支持了。

》位段的成员名后边有⼀个冒号和⼀个数字

使用方法如下：

struct stu

{

int _a : 2; //为a分配2个比特位

int _b : 3; //为b分配3个比特位

int _c : 4; //为c分配4个比特位

int _d : 5; //为d分配5个比特位

};

特别需要注意的是：位段使用的单位是比特位

并且，内存中一个字节给一个地址，由于修改了变量占用的内存空间，所以，不能对位段的成员使用&操作符

不能使⽤scanf直接给位段的成员输⼊值，只能是先输⼊放在⼀个变量中，然后赋值给位段的成员

struct stu

{

int _a : 1;

int _b : 20;

int _c : 2;

int _d : 3;

};

int main()

{

struct stu sa = { 0 };

scanf("%d", &sa._b); //这是错误的

int b = 0; //这里才是正确的

scanf("%d", &b);

sa._b = b;

return 0;

}

注意：由于一些平台不支持位段，需要可移植性好的程序，要避免使用位段

struct stu

{

int _a : 2;

int _b : 5;

int _c : 10;

int _d : 30;

};

int main()

{

printf("大小为%zd\n", sizeof(struct A));

return 0;

}
运行结果：大小为8

以下面这个代码为例，说明内存的分配：

struct S

{

char a : 3;

char b : 4;

char c : 5;

char d : 4;

};

int main()

{

struct S s = { 0 };

s.a = 10;

s.b = 12;

s.c = 3;

s.d = 4;

return 0;

}

C语言中，位段在一个字节内部是从高地址到低地址分配

当一个结构体包含两个位段，第二个位段比较大，无法容纳于第一个位段剩余的位时，舍弃

》12先转换为二进制01010，因为假设位段在一个字节内部是从高地址到低地址分配，所以从右往左分配，又因为只给a分配了三个比特位，所以只存进010

》然后12转换为二进制01100，因为只分配给b四个比特位，所以只存进1100

》3转换为二进制为00011，因为分配了c五个比特位，所以存进00011

》最后4转换为二进制00100，分配进四个比特位0100

2.9位段的缺陷

位段在跨平台问题上有很大的缺陷

因为：

》位段中最大位数目是不确定的（在16位机器上int型最大为16，而在32为机器上int型最大为 32，如若写成27，那么16位机器就会出问题

》int型位段成员会被当成有、无符号数是不确定的

》位段的成员在内存中到底是从左向右分配，还是从右向左分配尚未定义

**》**当一个结构体包含两个位段，第二个位段比较大，无法容纳于第一个位段剩余的位时， 舍弃剩余的位还是利用，是不确定的

2.10结构体传参

函数传参可以传参，也可以传址

#include<stdio.h>

struct stu

{

char name $20$ ;

int height;

char ID $20$ ;

};

void print1(struct stu zan)

{

printf("%s\n", zan.name); //传值调用

}

void print2(struct stu* zan)

{

printf("%s\n", zan->name); //传址调用

}

int main()

{

struct stu zan = { .name = "zhangsan", 180, .ID = "12023" };

print1(zan);

print2(&zan);

return 0;

}

传址调用 的效率高，节约内存占用，因为地址在内存中占用4或8个字节"