预处理详解

一.预定义符号

在C语言里设置了一些预定义符号,可以直接使用,预定义符号也是在预处理期间使用的。

FILE:进行编译的源文件

LINE:文件当前行号

DATE:文件被编译的日期

TIME:文件被编译的时间

STDC:如果编译器遵循ANSI C,其值为1,否则未定义

我们可以直接使用这些符号。

cpp 复制代码
#include<stdio.h>
int main()
{
	printf("%s\n", __FILE__);//我的是在D盘里的文件,这里可以直接把路径打印出来
	printf("%d\n", __LINE__);//这个就是此代码的行号
	printf("%s\n", __DATE__);//是你编译这个代码的日期
	printf("%s\n", __TIME__);//是你在编译这个代码的时间
    printf("%d\n", __STDC__);//报错------------我使用的VS2022不完全支持ANSIC
	return 0;
}

特别要说一下__STDC__,我使用的VS2022不完全支持ANSIC,所以是未定义的。

二.#define定义变常量

cpp 复制代码
#define MAX 1000
#define reg register //为 register这个关键字,创建⼀个简短的名字 
#define do_forever for(;;) //⽤更形象的符号来替换⼀种实现,这里是把forever定义为了一个死循环的for循环,以后在使用的时候这就是一个死循环
#define CASE break;case //在写case语句的时候⾃动把 break写上。 
// 如果定义的 stuff过⻓,可以分成⼏⾏写,除了最后⼀⾏外,每⾏的后⾯都加⼀个反斜杠(续⾏符)。
#define DEBUG_PRINT printf("file:%s\tline:%d\t \
                           date:%s\ttime:%s\n" ,\
                           __FILE__,__LINE__ , \
                           __DATE__,__TIME__ ) 

在进行预编译的时候,#define定义的东西会被完全替换掉。比如第一个我定义了MAX为1000,在预编译的过程中,只要遇到MAX就会被替换成1000,MAX就完全没有了。

注意:#define后面也可以跟一段代码,如上面的for的死循环。

还有就是如果定义的代码过长,可以分成几行写,除了最后⼀行外,每行的后面都加⼀个反斜杠(续行符)。
思考:在define定义标识符的时候,要不要在最后加上 ; ?

比如:

cpp 复制代码
#define MAX 1000;
#define MAX 1000

最好是不要加上;

cpp 复制代码
if(condition)
 max = MAX;
else
 max = 0;

如果我们加上了;那么这个代码就变成了

cpp 复制代码
if(condition)
 max = 1000;;
else
 max = 0;

如果是加了分号的情况,等替换后,if和else之间就是2条语句,而没有大括号的时候,if后边只能有⼀ 条语句。这里会出现语法错误。

再比如:

非特殊需求建议不要加上;

三.#define定义宏

#define机制包括了⼀个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或定义宏 (define macro)。实际上,定义宏就是比定义常量多了参数。

#define name(parament-list) stuff

其中的 parament-list 是⼀个由逗号隔开的符号表,它们可能出现在stuff中

注意:参数列表的左括号必须与name紧邻,如果两者之间有任何空白存在,参数列表就会被解释为stuff的一部分。也就是说name(parament-list)不能写成name (parament-list)。

举个例子:

cpp 复制代码
#define add(x,y) x+y
#include<stdio.h>
int main()
{
	int a = 1;
	int b = 2;
	printf("%d", add(a, b));
	return 0;
}

在经过预编译之后,这个代码会变成

cpp 复制代码
#define add(x,y) x+y
#include<stdio.h>
int main()
{
	int a = 1;
	int b = 2;
	printf("%d", a+b);
	return 0;
}

也成功的打印出来相加的结果3。注意这里的add里的参数是不需要写类型的,因为这里是纯替换。

注意:所以用于对数值表达式进行求值的宏定义都应该用这种方式加上括号,避免在使用宏时由于参数中的 操作符或邻近操作符之间不可预料的相互作用。

这里我写的这个代码体现不出来。我在写一个

cpp 复制代码
#define squ(x) x*x
#include<stdio.h>
int main()
{
	int a = 5;
	printf("%d\n", squ(a+1));
	return 0;
}

这里我希望打印出来的值是36,但是最终打印出来的值是11。因为这里的定义宏是纯替换,参数里他不管你放的是一个数字还是一个表达式,这里都给替换成a+1*a+1.a的值是5,再给带入是5+1*5+1.最终是11。

所以说我们在定义宏的时候最好写成:#define squ(x) ((x)*(x)) 给x多套几个括号。

四.带有副作用的宏参数

当宏参数在宏的定义中出现超过⼀次的时候,如果参数带有副作用,那么你在使用这个宏的时候就可能出现危险,导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。

比如:x+1;不带副作用

x++;带有副作用

有下面的代码:

cpp 复制代码
#define MAX(x,y) ((x)>(y)?(x):(y))
#include<stdio.h>
int main()
{
	int a = 3;
	int b = 5;
	int m = MAX(a++, b++);
	//  ((a++)>(b++)?(a++):(b++))
	//     4     6    5     7 
	printf("m=%d\n", m);
	printf("a=%d\n", a);
	printf("b=%d\n", b);
	return 0;
}

输出的是m为6,a为4,b用了两次后置加加所以为7.

注意宏跟函数是不一样的。函数传参可不是直接替换,比如这里的a++和b++,函数会直接把a和b的值传参,而宏直接替换掉里面的所有x和y。

这就是有副作用的宏参数

五.宏替换的规则

在程序中扩展#define定义符号和宏时,需要涉及几个步骤。

  1. 在调用宏时,首先对参数进行检查,看看是否包含任何由#define定义的符号。如果是,它们首先被替换。

  2. 替换文本随后被插入到程序中原来文本的位置。对于宏,参数名被他们的值所替换。

  3. 最后,再次对结果文件进行扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上述处理过程。

比如下面代码

cpp 复制代码
#define MAX(x,y) ((x)>(y)?(x):(y))
#define M 10
#include<stdio.h>
int main()
{
	int a = 3;
	int m = MAX(a, M);
	//M会被首先替换为10
	//int m = MAX(a, 10);
	//然后再进行扫描,MAX被宏定义了,所以再次替换
	//((a)>(10)?(a):(10))
	printf("m=%d\n", m);
	return 0;
}

注意: 1. 宏参数和#define 定义中可以出现其他#define定义的符号。但是对于宏,不能出现递归。2. 当预处理器搜索#define定义的符号的时候,字符串常量的内容并不被搜索。

也就是说,在宏内部的参数也是可以出现宏的,但是不能出现递归

cpp 复制代码
#define MAX(x,y) ((x)>(y)?(x):(y))
#define M 10
#include<stdio.h>
int main()
{
	int a = 3;
	int m = MAX(a, MAX(2,3));
	printf("m=%d\n", m);
	return 0;
}

六.宏与函数的对比

宏通常被应用于执行简单的运算。 比如在两个数中找出较大的一个时,写成下面的宏,更有优势⼀些。

#define MAX(x,y) ((x)>(y)?(x):(y))

就以这个找最大值来说,宏比函数要好:

  1. 用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。所以宏比函数在程序的规模和速度方面更胜一筹(因为函数有需要调用函数的时间,执行运算的时间,还有函数返回的时间,而宏就只有执行预算的时间)。

  2. 更为重要的是函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。反之这个宏怎可以适用于整形、长整型、浮点型等可以用于 > 来比较的类型。宏的参数是类型无关的。

但是宏也是有劣势:

  1. 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度。(因为是直接替换,如果我定义一个比较长的宏,那么我多调用几次,它的长度也在不断增加)

  2. 宏是没法调试的。(在预编译之后,宏都被直接替换了,真正编译器执行的是替换后的代码)

  3. 宏由于类型无关,也就不够严谨。

  4. 宏可能会带来运算符优先级的问题,导致程容易出现错。

宏有时候可以做函数做不到的事情。比如:宏的参数可以出现类型,但是函数做不到。

这个也是一个很牛的一个点,我们知道,函数的参数是不可以直接传过去一个类型的,但是宏可以。

cpp 复制代码
#define Malloc(n,type) (type*)malloc(n*sizeof(type))
int main()
{
	int* ptr = Malloc(10, int);
	//int* ptr=(int*)malloc(10*sizeof(int))
	return 0;
}

这就是利用宏来传递类型,函数是绝对不可以的。

下面总结一下它们的区别:

|----------|--------------------------------------------------------|---------------------------------------------|
| 属性 | #define定义宏 | 函数 |
| 代码长度 | 每次使用时宏代码都会被插入到程序中,除了非常小的宏之外程序的长度会大幅度增长 | 函数代码只出现于一个地方;每次使用这个函数时都调用那个地方的同一份代码 |
| 执行速度 | 更快 | 相对慢一些 |
| 操作符优先级 | 宏参数的求值是在所有周围表达式的上下文环境里,除非加上括号,否则邻近的操作符的优先级可能会产生不可预料的后果 | 函数参数只在调用的时候使用一次,它的结果值传递给函数,表达式的求值更容易预测 |
| 带有副作用的参数 | 参数可能被替换到宏体的多个位置,如果宏的参数被多次运算,可能会产生不可预料的后果 | 函数参数只在传参的时候求值一次,结果更容易控制 |
| 参数类型 | 宏的参数与类型无关,只要对参数的的操作是合法的,它就可以使用于任何参数类型 | 函数的参数与类型有关,如果参数的类型不同,就需要不同的参数,即使它们执行的任务是相同的 |
| 调试 | 不方便调试 | 可以逐语句调试 |
| 递归 | 不能递归 | 可以递归 |

七.#和##

1.#运算符

注意这里的#可不是#define里的#,这里的#是一个单独的操作符。

#运算符将宏的一个参数转换为字符串字面量。它仅允许出现在带参数的宏的替换列表中

#运算符所执行的操作可以理解为"字符串化"。

cpp 复制代码
#define Print(n,format) printf("the value of "#n" is "format"\n",n)
#include<stdio.h>
int main()
{
	int a = 0;
	Print(a, "%d");
	int b = 10;
	Print(b, "%d");
	float c = 20;
	Print(c, "%f");
	return 0;
}

上面的#n就可以被替换成"a"。注意了是带有双引号的a,对于#n不是替换成对应的值而是转换成对应的字符串。这样就可以把一整段打印出来了 。

2.##运算符

可以把位于它两边的符号合成一个符号,它允许宏定义从分离的文本片段创建标识符。

被称为记号粘合这样的连接必须产生一个合法的标识符。否则其结果就是未定义的。 这里我们想想,写⼀个函数求2个数的较大值的时候,不同的数据类型就得写不同的函数。

比如

cpp 复制代码
int int_max(int x, int y)
{
 return x>y?x:y;
}
float float_max(float x, float y)
{
 return x>yx:y;
}

不同类型的数据比较的时候,用函数来写,就要写多个函数来实现。

但是我们可以用#define的方式来实现这个方法。

cpp 复制代码
#define MAX(type)\
type type##_max(type x, type y)\
{\
   return x>y?x:y;\
}
//声明
MAX(int);
MAX(float);
#include<stdio.h>
int main()
{
	int a = 3;
	int b = 5;
	int r1=int_max(a, b);
	printf("%d\n", r1);
	float c = 3.1f;
	float d = 4.2f;
	float r2 = float_max(c, d);
	printf("%f", r2);
	return 0;
}

这里的##就是把前面的type和后面的_max合为一个。如果不加##的话,这里就成了type_max,type是不能被替换的。其实#define就相当于是提供了一个模版,后面需要比较什么就直接加上就好了。在实际开发过程中##使用的很少。

八.命名约定

⼀般来讲函数的宏的使用语法很相似。所以语言本身没法帮我们区分二者。 那我们平时的⼀个习惯是:

把宏名全部大写

函数名不要全部大写

当然也不是一定就是这样。

offsetof------宏。计算结构体成员相较于起始位置的偏移量

九.#undef

这条指令用于移除一个宏定义。

就拿一个前面写过的一个代码:

cpp 复制代码
#define Print(n,format) printf("the value of "#n" is "format"\n",n)
#include<stdio.h>
int main()
{
	int a = 0;
	Print(a, "%d");
#undef Print
	int b = 10;
	Print(b, "%d");
	return 0;
}

这就就会报警告。

十.命令行定义

许多C的编译器提供了⼀种能力,允许在命令行中定义符号。用于启动编译过程。例如:当我们根据同⼀个源文件要编译出⼀个程序的不同版本的时候,这个特性有点用处。(假定某个程序中声明了⼀个某个长度的数组,如果机器内存有限,我们需要⼀个很小的数组,但是另外⼀个机器内存大些,我们需要⼀个数组能够大些。)

比如:

cpp 复制代码
#include <stdio.h>
int main()
{
 int arr[sz];
 int i = 0;
 for(i = 0; i<sz; i ++)
 {
 array[i] = i;
 }
 for(i = 0; i< sz; i ++)
 {
 printf("%d " ,arr[i]);
 }
 printf("\n" );
 return 0;
}

注意我这里面的sz是没有定义的。我们就可以在命令行来编译它:

linux环境

gcc -D sz=10 programe.c

我们想要什么值就可以直接在命令行输入就可以了。

十一.条件编译

在编译一个程序的时候我们如果要将⼀条语句(⼀组语句)编译或者放弃是很方便的。因为我们有条件编译指令。

比如说:

调试性的代码,删除可惜,保留又碍事,所以我们可以选择性的编译。

简单的说,这一段代码我想让它编译就让它编译,不想编译就不编译。

cpp 复制代码
#include <stdio.h>
#define __DEBUG__//相当于一个开关
int main()
{
	int arr[10] = { 0 };
	for (int i = 0; i < 10; i++)
	{
		arr[i] = i;
#ifdef __DEBUG__
		printf("%d\n", arr[i]);//为了观察数组是否赋值成功。  
		//我想用这个代码就保留住前面的#define __DEBUG__,如果不要这个代码就直接把这个代码删掉或者注释掉
#endif //__DEBUG__
	}
	return 0;
}

在C中有许多的条件编译指令:

cpp 复制代码
//第一种
#if 常量表达式
 //...
#endif
//常量表达式由预处理器求值。

//第二种
//多个分⽀的条件编译
#if 常量表达式
 //...
#elif 常量表达式
 //...
#else
 //...
#endif

//第三种
//判断是否被定义
#if defined(symbol)
#ifdef symbol
#if !defined(symbol)
#ifndef symbol

//第四种
//嵌套指令
#if defined(OS_UNIX)
      #ifdef OPTION1
             unix_version_option1();
      #endif
      #ifdef OPTION2
             unix_version_option2();
      #endif
#elif defined(OS_MSDOS)
      #ifdef OPTION2
              msdos_version_option2();
      #endif
#endif

十二.头文件的包含

1.头文件被包含的方式

(1)本地文件包含

我们自己写的头文件叫本地文件,当我们需要包含我们自己的写的头文件时用双引号:

关于本地文件包含的查找策略:先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件⼀样在标准位置查找头文件。 如果找不到就提示编译错误。

Linux环境的标准头文件的路径:

/usr/include

VS环境的标准头文件的路径:

C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\include

这是VS2013的默认路径

注意当我们使用双引号的查找方式,它会查找两次。

(2)库文件包含

这就是我们熟悉的<>的方式了

查找头文件直接去标准路径下去查找,如果找不到就提示编译错误。 这样是不是可以说,对于库文件也可以使用 "" 的形式包含? 答案是肯定的,可以,但是这样做查找的效率就低些,当然这样也不容易区分是库文件还是本地文件了。

2.嵌套文件包含

在我们不经意的时候可以会出现这种情况。

我们已经知道, #include 指令可以使另外一个文件被编译。

就像它实际出现于 #include 指令的地方⼀样。 这种替换的方式很简单:预处理器先删除这条指令,并用包含文件的内容替换。 ⼀个头文件被包含10次,那就实际被编译10次,如果重复包含,对编译器的压力就比较大。

也就是说,我在这里多次包含我的Add.h头文件。那么在预编译的过程,我包含了几次,就会出现多少次我头文件里的内容,代码的长度会大幅度增加,在编译时的对编译器的压力也会更大。

那我们怎么才能避免这个情况呢?我们只需要在头文件里加三个语句就可以了:

cpp 复制代码
#ifndef _Add_H_
#define _Add_H_
int Add(int a, int b)
{
	return a + b;
}
#endif

当我们第一次包含头文件时,此时的 _Add_H_是没有被定义的,所以这个包含是可行的,当我们再一次包含这个头文件时,此时的 _Add_H_已经被定义,相当于下面的代码都不会在参与编译了。

或者:

cpp 复制代码
#pragma once
int Add(int a, int b)
{
	return a + b;
}

这个里面的#pragma once和上面的作用是一样的。都可以避免头文件的重复引入。

到这里这节差不多就都结束了,概念性的知识偏多,不难,但需要我们好好记忆。

感谢大家的观看,如有错误还请大家多多指出。

相关推荐
陌小呆^O^3 分钟前
Cmakelist.txt之win-c-udp-client
c语言·开发语言·udp
cherub.6 分钟前
深入解析信号量:定义与环形队列生产消费模型剖析
linux·c++
机器学习之心9 分钟前
一区北方苍鹰算法优化+创新改进Transformer!NGO-Transformer-LSTM多变量回归预测
算法·lstm·transformer·北方苍鹰算法优化·多变量回归预测·ngo-transformer
I_Am_Me_19 分钟前
【JavaEE进阶】 JavaScript
开发语言·javascript·ecmascript
yyt_cdeyyds19 分钟前
FIFO和LRU算法实现操作系统中主存管理
算法
重生之我是数学王子29 分钟前
QT基础 编码问题 定时器 事件 绘图事件 keyPressEvent QT5.12.3环境 C++实现
开发语言·c++·qt
梅见十柒30 分钟前
wsl2中kali linux下的docker使用教程(教程总结)
linux·经验分享·docker·云原生
Ai 编码助手31 分钟前
使用php和Xunsearch提升音乐网站的歌曲搜索效果
开发语言·php
Koi慢热33 分钟前
路由基础(全)
linux·网络·网络协议·安全
学习前端的小z35 分钟前
【前端】深入理解 JavaScript 逻辑运算符的优先级与短路求值机制
开发语言·前端·javascript