结构体(C语言)

"点赞,留言,收藏,关注"

就是对阿林最大的支持

1.自定义类型

什么是自定义类型?C语言中有一些自带的数据类型,比如说char,int,float,double,long等数据类型就是C语言的内置类型

在生活中,要描述一件东西,往往有很多的参数 ,只是靠内置类型就显得数据零散,或者说不太够用,所以C语言除了内置类型之外又有了自定义类型,结构体、联合体便是自定义类型

2.结构体

结构体定义是由关键字 struct 和结构体名组成,结构体名可以根据需要自行定义。struct 语句定义了一个包含多个成员的新的数据类型,struct 语句的格式如下:

struct tag //结构体类型

{

member-list //结构体成员

member-list ... //结构体成员

} variable-list ;

tag是结构体标签,定义结构体类型,如book,student等
member-list 是标准的变量定义,比如 int i; 或者 float f;,也可以定义数组char s[20]
variable-list结构变量,定义在结构的末尾,最后一个分号之前,表示全局的结构体,可以指定一个或多个结构变量,也可省略

给出一个简单的结构的例子:

2.1普通结构体

struct student //假设这是一个学生信息的结构体

{

int age; //年龄

char name[20]; //名字

char ID[25]; //学号

char sex[6]; //性别

};

int main()

{

struct student zhangsan = { .age = 18, .ID = "12023", .sex = "男", .name = "张三" };

return 0;

}

2.2嵌套结构体

和函数一样,结构体也可以嵌套使用,也就是在一个结构体中使用另外一个结构体,也可以包含指向自己结构体类型的指针 ,而通常这种指针的应用是为了实现一些更高级的数据结构如链表等。

struct student

{

int age; //年龄

char sex[6]; //性别

int weight; //体重

};

struct people

{

int num; //序号

struct student s; //学生s

};

2.3匿名结构体

如下:

struct//匿名结构体

{

int num;

char name[20];

};

struct

{

int a;

char b;

float c;

}x;

struct

{

int a;

char b;

float c;

}*p;

p = &x; //两种结构体不同无法赋值

匿名结构体是不定义结构体名称,直接定义其成员,这种结构体只能使用一次。并且两个匿名结构体的成员如果都相同的话,这两个匿名结构体也是不同的

注意:匿名结构体在程序中只能使用一次

2.4typedef重命名结构体

结构体名称在使用时,类型和名称较长,这时我们就可以使用typedef来简化

写法如下:

typedef struct student

{

int age;

char sex[6];

int weight;

}stu;

//这样写完后,可以用stu代替struct student

但是需要注意的是:不能 在重命名前使用重命名后的结构体

typedef struct student

{

int age;

char sex[8];

int weight;

char tele[20];

stu* next; //这里使用了重命名后的结构体

}stu; //实际上代码走到这里才知道结构体重命名为stu

2.5结构体的访问

struct student //假设这是一个学生信息的结构体

{

int age; //年龄

char name[20]; //名字

char ID[25]; //学号

char sex[6]; //性别

};

int main()

{

struct student zhangsan = { .age = 18, .ID = "12023", .sex = "男", .name = "张三" };

//这里使用了" . 成员名"进行访问

return 0;

}

2.6结构体对齐

既然一个结构体里面有多个变量,那他们是怎么存储的呢?一个结构体的大小是多少呢?

struct example

{

int num;

char a;

float b;

int p;

}s;

int main()

{

size_t sz = sizeof(s);

printf("大小为%zd\n", sz);

return 0;

}

按照我们的直觉,int是4个字节,char是1个字节,float是4个字节

全部加起来是 13个字节

实际上运行结果(VS2022):

16

其实我们之前一直学的都是,数据 在内存中连续存储,,而C语言存在内存对齐

内存对齐规则:

》结构体的第⼀个成员对⻬到和结构体变量起始位置偏移量为0的地址处

》其他成员变量要对⻬到某个数字(对⻬数)的整数倍的地址处

》对⻬数 = 编译器默认的⼀个对⻬数与该成员变量⼤⼩的较⼩值。(VS 中默认的值为 8 , Linux中gcc没有默认对齐数,对⻬数就是成员⾃⾝的⼤⼩)

》结构体总⼤⼩为最⼤对⻬数(结构体中每个成员变量都有⼀个对⻬数,所有对⻬数中最⼤ 的)的整数倍

》如果嵌套了结构体的情况,嵌套的结构体成员对⻬到⾃⼰的成员中最⼤对⻬数的整数倍处 结构体的整体⼤⼩就是所有最⼤对⻬数(含嵌套结构体中成员的对⻬数)的整数倍

为什么要内存对齐呢?

》平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件 平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常

》性能原因:数据结构(尤其是栈)应该尽可能地在⾃然边界上对⻬。原因在于,为了访问未 对⻬的内存,处理器需要作两次内存访问;⽽对⻬的内存访问仅需要⼀次访问。假设⼀个 处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证将所有的double 类型的数据的地址都对⻬成8的倍数,那么就可以⽤⼀个内存操作来读或者写值了。否 则,我们可能需要执⾏两次内存访问,因为对象可能被分放在两个8字节内存块中

用例子说明内存对齐:

#include<stddef.h>

struct Stu

{

char ch;

int i;

char ch2;

};

int main()

{

return 0;

}

左侧数字是偏移量,上图可描述结构体的内存对齐

未填充颜色的区域,表示未使用的内存,说明内存被浪费了

》c1是一个char类型占一个字节,根据内存对齐第一条规则,放在偏移量为0处

》i是int类型占四个字节,根据内存对齐第二,三规则,默认对齐数是4,对齐至4的整数 倍, 中间浪费三个字节,偏移量为4

》c2也是char类型占一个字节,默认对齐数是1的整数倍,偏移量为8

用一个实例验证:

#include<stdio.h>

struct stu

{

char ch;

int a;

int b;

};

int main()

{

printf("%zd\n", sizeof(struct stu));

return 0;

}

根据结构体的对齐规则,

char类型的ch放在偏移量为0的位置

int类型的a对齐数是4,放在偏移量4-7的位置,与上一个数据间隔了3个字节

int类型的b对齐数是4,放在偏移量8-11的位置

整个结构体占用的内存应该是4的整数倍,能存下最小内存是12个字节

VS2022运行结果: 12

2.7修改默认对齐数

既然对齐数被c语言默认了,我们能不能自行更改呢?答案是可以的

#pragma 这个预处理指令,我们可以通过它来改变编译器的默认对⻬数

#include <stdio.h>

#pragma pack(1)

struct Stu

{

char ch;

int i;

char ch2;

};

#pragma pack()

int main()

{

printf("大小为%d\n", sizeof(struct Stu));

return 0;

}

我们可以看到,使用了两次pragma

因为使用#pragma(1)修改对齐数后,便会以这个对齐数向下执行,需要及时恢复为默认对齐数,以免对后续代码造成影响

运行结果:6

因为对齐数是1,结构体数据在内存中是连续存储的,就等于各成员占用空间之和

2.8位段

什么是位段

有些数据在存储时并不需要占用一个完整的字节,只需要占用一个或几个二进制位即可,所以C 语言有一种特别的数据结构名为位段,允许我们按位对成员进行定义,指定占用的位数单位为比特位(bit)。一般是用来节约内存,与结构体有两个不同

》位段的成员必须是 int、unsigned int 或signed int ,char等整型。到了 C99,_Bool 也被支持了。

》位段的成员名后边有⼀个冒号和⼀个数字

使用方法如下:

struct stu

{

int _a : 2; //为a分配2个比特位

int _b : 3; //为b分配3个比特位

int _c : 4; //为c分配4个比特位

int _d : 5; //为d分配5个比特位

};

特别需要注意的是:位段 使用的单位比特位

并且,内存中一个字节给一个地址,由于修改了变量占用的内存空间,所以,不能对位段的成员使用&操作符

不能使⽤scanf直接给位段的成员输⼊值,只能是先输⼊放在⼀个变量中,然后赋值给位段的成员

struct stu

{

int _a : 1;

int _b : 20;

int _c : 2;

int _d : 3;

};

int main()

{

struct stu sa = { 0 };

scanf("%d", &sa._b); //这是错误的

int b = 0; //这里才是正确的

scanf("%d", &b);

sa._b = b;

return 0;

}

注意:由于一些平台不支持位段,需要可移植性好的程序,要避免使用位段

struct stu

{

int _a : 2;

int _b : 5;

int _c : 10;

int _d : 30;

};

int main()

{

printf("大小为%zd\n", sizeof(struct A));

return 0;

}
运行结果: 大小为8

以下面这个代码为例,说明内存的分配:

struct S

{

char a : 3;

char b : 4;

char c : 5;

char d : 4;

};

int main()

{

struct S s = { 0 };

s.a = 10;

s.b = 12;

s.c = 3;

s.d = 4;

return 0;

}

C语言中,位段在一个字节内部是从高地址到低地址分配

当一个结构体包含两个位段,第二个位段比较大,无法容纳于第一个位段剩余的位时, 舍弃

》12先转换为二进制01010,因为假设位段在一个字节内部是从高地址到低地址分配,所以 从右往左分配,又因为只给a分配了三个比特位,所以只存进010

》然后12转换为二进制01100,因为只分配给b四个比特位,所以只存进1100

》3转换为二进制为00011,因为分配了c五个比特位,所以存进00011

》最后4转换为二进制00100,分配进四个比特位0100

2.9位段的缺陷

位段在跨平台问题上有很大的缺陷

因为:

》位段中最大位数目是不确定的(在16位机器上int型最大为16,而在32为机器上int型最大 为 32,如若写成27,那么16位机器就会出问题

》int型位段成员会被当成有、无符号数是不确定的

》位段的成员在内存中到底是从左向右分配,还是从右向左分配尚未定义

**》**当一个结构体包含两个位段,第二个位段比较大,无法容纳于第一个位段剩余的位时, 舍弃剩余的位还是利用,是不确定的

2.10结构体传参

函数传参可以传参 ,也可以传址

#include<stdio.h>

struct stu

{

char name[20];

int height;

char ID[20];

};

void print1(struct stu zan)

{

printf("%s\n", zan.name); //传值调用

}

void print2(struct stu* zan)

{

printf("%s\n", zan->name); //传址调用

}

int main()

{

struct stu zan = { .name = "zhangsan", 180, .ID = "12023" };

print1(zan);

print2(&zan);

return 0;

}

传址调用效率高,节约内存占用,因为地址在内存中占用4或8个字节"

相关推荐
许野平23 分钟前
Rust: 利用 chrono 库实现日期和字符串互相转换
开发语言·后端·rust·字符串·转换·日期·chrono
也无晴也无风雨26 分钟前
在JS中, 0 == [0] 吗
开发语言·javascript
狂奔solar34 分钟前
yelp数据集上识别潜在的热门商家
开发语言·python
朱一头zcy1 小时前
C语言复习第9章 字符串/字符/内存函数
c语言
此生只爱蛋1 小时前
【手撕排序2】快速排序
c语言·c++·算法·排序算法
blammmp1 小时前
Java:数据结构-枚举
java·开发语言·数据结构
何曾参静谧1 小时前
「C/C++」C/C++ 指针篇 之 指针运算
c语言·开发语言·c++
暗黑起源喵1 小时前
设计模式-工厂设计模式
java·开发语言·设计模式
WaaTong2 小时前
Java反射
java·开发语言·反射
Troc_wangpeng2 小时前
R language 关于二维平面直角坐标系的制作
开发语言·机器学习