👦个人主页：Weraphael

✍🏻作者简介：目前正在回炉重造C语言（2023暑假）

✈️专栏：【C语言航路】

🐋 希望大家多多支持，咱一起进步！😁

如果文章对你有帮助的话

欢迎评论💬 点赞👍🏻 收藏 📂 加关注😍

一、程序的翻译环境和执行环境
[二、详解编译 + 链接（重点）](#二、详解编译 + 链接（重点）)
- - [2.1 翻译环境](#2.1 翻译环境)
  - [2.2 细分编译的几个阶段](#2.2 细分编译的几个阶段)
  - [2.3 运行环境](#2.3 运行环境)
三、预处理详解
- - [3.1 预定义符号](#3.1 预定义符号)
  - [3.2 #define（重点）](#define（重点）)
  - - [3.2.1 #define 定义标识符](#define 定义标识符)
    - [3.2.2 #define 定义宏](#define 定义宏)
    - [2.2.3 #define 替换规则](#define 替换规则)
    - 3.2.4 #和##
    - [3.2.5 带副作用的宏参数](#3.2.5 带副作用的宏参数)
    - [3.2.6 宏和函数对比](#3.2.6 宏和函数对比)
    - [3.2.7 命名约定](#3.2.7 命名约定)
  - 3.3 #undef
  - [3.4 命令行定义](#3.4 命令行定义)
  - [3.5 条件编译](#3.5 条件编译)
  - [3.6 文件包含](#3.6 文件包含)
  - - [3.6.1 头文件被包含的方式：](#3.6.1 头文件被包含的方式：)
    - [3.6.2 嵌套文件包含](#3.6.2 嵌套文件包含)

一、程序的翻译环境和执行环境

在标准C的任何一种实现中，存在两个不同的环境

第一种是翻译环境，在这个环境中源代码被转换为可执行的机器指令（二进制指令）

第二种是执行环境，它用于实际执行代码

二、详解编译 + 链接（重点）

2.1 翻译环境

翻译环境分为两个步骤

编译。编译又被分为三个过程：预编译，编译，汇编

链接。

【程序编译过程】

组成一个程序的每个源文件通过编译过程分别转换成目标代码。
每个目标文件由链接器捆绑在一起，形成一个单一而完整的可执行程序。
链接器同时也会引入标准C函数库（链接库）中任何被该程序所用到的函数，而且它可以搜索程序员个人的程序库，将其需要的函数也链接到程序中。

2.2 细分编译的几个阶段

【预编译阶段】

【编译阶段】

【汇编阶段】

【链接阶段】

段表是目标文件中描述程序各个段的数据结构，包括段的名称、大小、属性等信息。
符号表则是目标文件中记录程序中全局变量、函数等符号的数据结构，包括符号的名称、类型、地址等信息。

而符号表的合并和重定位是将多个目标文件中的符号表合并，并根据符号地址的重定位信息，调整符号的地址值。这样可以解决不同目标文件中同名符号引起的冲突问题，并确保最终生成的可执行文件或共享库中的符号地址是正确的。

因此在链接过程中，合并段表是将多个目标文件的段表合并为一个整体的过程。这样可以确保最终生成的可执行文件或共享库包含了所有需要的段信息，以便正确地加载和执行程序。

2.3 运行环境

程序执行的过程：

程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中，程序的载入必须由手工安排，也可能是通过可执行代码置入只读内存来完成。
程序的执行便开始。接着便调用main函数。
开始执行程序代码。这个时候程序将使用一个运行时堆栈（函数栈帧），存储函数的局部变量和返回地址，程序同时也可以使用静态内存，存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
终止程序。正常终止main函数;也有可能是意外终止

三、预处理详解

3.1 预定义符号

cpp 复制代码

__FILE__ //进行编译的源文件
__LINE__ //文件当前的行号
__DATE__ //文件被编译的日期
__TIME__ //文件被编译的时间
__STDC__ //如果编译器遵循ANSI C，其值为1，否则未定义
         // VS不支持，gcc是支持
__FUNCTION__//函数名

这些预定义符号都是语言内置的。

例如：

注意：在gcc环境下，这些预定义符号在预编译（预处理）阶段就会替换掉对应的内容：

3.2 #define（重点）

3.2.1 #define 定义标识符

【语法】

cpp 复制代码

#define name stuff

【例子】

cpp 复制代码

#define MAX 1000
#define reg register //为 register这个关键字，创建一个简短的名字
#define do_forever for(;;) //用更形象的符号来替换一种实现
#define CASE break;case //在写case语句的时候自动把 break写上。
// 如果定义的 stuff过长，可以分成几行写，除了最后一行外，每行的后面都加一个反斜杠(续行符)。
#define DEBUG_PRINT printf("file:%s\tline:%d\t \
date:%s\ttime:%s\n" ,\
__FILE__,__LINE__ , \
__DATE__,__TIME__ )

【提问】

在define定义标识符的时候，要不要在最后加上 ; ?

建议不要加上，这样容易导致问题

比如下面的场景：

cpp 复制代码

#include <stdio.h>
#define MAX 100;
int main()
{
	int condition = 0;
	int max = 1;
	scanf("%d", &condition);
	if (condition)
		max = MAX;
	else
		max = 0;
	return 0;
}

在预处理阶段，他会把代码替换成以下这样：

出现了两个分号，导致语法错误！

3.2.2 #define 定义宏

#define机制包括了一个规定：允许把参数替换到文本中，这种实现通常称为宏或定义宏

【声明方式】

cpp 复制代码

#define name(parament-list) stuff

其中的parament-list是一个由逗号隔开的符号表，它们可能出现在stuff中

【注意】

参数列表的左括号必须与name紧邻，不能有空格。
如果两者之间有任何空白存在，参数列表就会被解释为stuff的一部分。

【代码样例】

cpp 复制代码

#include <stdio.h>

// 定义平方
#define SQUARE(X) X*X

int main()
{
	// 求5的平方
	printf("%d\n", SQUARE(5));
	// 5.0的平方
	printf("%lf\n", SQUARE(5.0));

	return 0;
}

在预处理阶段就被翻译成以下形式：

但以上宏还存在一些问题，假设要求5+1的平方：

按照正常算出来应该是36，但结果却是11。这是因为宏替换，它会被替换成以下形式：

如何解决以上问题呢？在宏定义上加上两个括号，以上问题便可以轻松的解决了：

cpp 复制代码

#define SQUARE(X) (X) * (X)

接下来这里还有一个宏定义：

cpp 复制代码

#define DOUBLE(x) (x) + (x)

定义中我们使用了括号，想避免之前的问题，但是这个宏可能会出现新的错误。

看上去，好像打印100，但事实上打印的是55，这是因为我们发现替换后

cpp 复制代码

printf ("%d\n",10 * (5) + (5));

乘法运算先于宏定义的加法，所以结果为55

这个问题的解决办法是在宏定义表达式两边加上一对括号就可以了。

cpp 复制代码

#define DOUBLE( x) ( ( x ) + ( x ) )

【总结】

所以用于对数值表达式进行求值的宏定义都应该给 参数加上括号以及整体加上括号，避免在使用宏时由于参数中的操作符或邻近操作符之间不可预料的相互作用

2.2.3 #define 替换规则

在程序中扩展#define定义符号和宏时，需要涉及几个步骤。

在调用宏时，首先对参数进行检查，看看是否包含任何由#define定义的符号。如果是，它们首先被替换。
替换文本随后被插入到程序中原来文本的位置。对于宏，参数名被他们的值所替换。
最后，再次对结果文件进行扫描，看看它是否包含任何由#define定义的符号。如果是，就重复上
述处理过程。

注意：

宏参数和#define定义中可以出现其他#define定义的符号。但是对于宏，不能出现递归。
当预处理器搜索#define定义的符号的时候，字符串常量的内容并不被替换。

3.2.4 #和##

首先我们看看这样的代码：

cpp 复制代码

#include <stdio.h>

int main()
{
	printf("hello world\n");
	printf("hello"" world\n");
	return 0;
}

以上输出的结果是否都是hello world？

【输出结果】

答案显而易见了，因此可以得出一个结论：字符串是有自动连接的特点的

回归正题，现有以下代码：

cpp 复制代码

#include <stdio.h>

int main()
{
	int a = 10;
	printf("the value of a is %d\n", a);

	int b = 20;
	printf("the value of b is %d\n", b);

	return 0;
}

能否把它统一用宏来表示呢？不少人照猫画虎就会写出以下代码：

cpp 复制代码

#include <stdio.h>

#define PRINT(x) printf("the value of x is %d\n", x)

int main()
{
	int a = 10;
	PRINT(a);

	int b = 20;
	PRINT(b);

	return 0;
}

【输出结果】

通过输出结果我们发现，代码写死了。如何将x替换成相对应的字符呢？使用#，把一个宏参数变成对应的字符串

#的作用：当a传给宏的参数，就会转换成对应的字符串，变成双引号"a"，因此代码本质就是：

cpp 复制代码

#include <stdio.h>

int main()
{
	int a = 10;
	printf("the value of ""a"" is %d\n", a);

	int b = 20;
	printf("the value of ""b"" is %d\n", b);

	return 0;
}

但是上述代码也不完全通用，假设要打印的是一个浮点型的数据，格式还是不统一，因此PRINT就再加一个参数：

cpp 复制代码

#include <stdio.h>

#define PRINT(format, x) printf("the value of "#x" is "format"\n", x)

int main()
{
	int a = 10;
	PRINT("%d", a);

	double d = 3.14;
	PRINT("%lf", d);
	
	return 0;
}

替换后的本质：

【## 的作用】

##可以把位于它两边的符号合成一个符号。注：这样的连接必须产生一个合法的标识符。否则其结果就是未定义的

【定义】

【代码样例】

cpp 复制代码

#include <stdio.h>
#define CAT(x, y) x##y
int main()
{
	int name91 = 20;
	printf("%d\n", CAT(name,91));

	return 0;
}

【输出结果】

用Linux环境下看预编译，上述代码就被替换成：

3.2.5 带副作用的宏参数

当宏参数在宏的定义中出现超过一次的时候，如果参数带有副作用，那么你在使用这个宏的时候就可能出现危险，导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。

【例如】

cpp 复制代码

x+1;//不带副作用
x++;//带有副作用

【代码样例】

以下代码的输出结果是？

cpp 复制代码

#include <stdio.h>

// 注意宏的书写
#define MAX(x, y) ((x) > (y) ? (x) : (y))

int main()
{
	int a = 0;
	int b = 1;
	int max = MAX(a++, b++);
	printf("%d\n", max);

	return 0;
}

很多人认为以上代码输出的结果是1，其实并不是

【输出结果】

认为是答案是1的读者肯定是先计算了a++和b++，注意：宏并不是函数，它是个 替换。 因此代码其实替换成了以下形式：

对于三目操作符，首先先判断a++(0)是否大于b++(1)，表达式为假，则执行b++，由于++是有副作用的，因此b由一开始的1变成了2，又因为b++是先使用，后++，所以最后的结果就是2

3.2.6 宏和函数对比

注意：宏通常被应用于执行简单的运算

比如在两个数中找出较大的一个

cpp 复制代码

#define MAX(x, y) ((x) > (y) ? (x) : (y))

那为什么不用函数来完成这个任务？

原因有两点：

用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。所以宏比函数在程序的规模和速度方面更胜一筹。
更为重要的是 函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。反之这个 宏可以适用于任何类型。

【宏的缺点】

每次使用宏的时候，一份宏定义的代码将插入到程序中。除非宏比较短，否则可能大幅度增加程序的长度。
宏是没法调试的。这是因为宏的代码在预处理就被替换成宏的内容对应的代码了。
宏由于类型无关，也就不够严谨。
宏可能会带来运算符优先级的问题，导致容易写错并且程序也容易出错

对了，宏有时候可以做函数做不到的事情。比如：宏的参数可以出现类型，但是函数做不到。

例如：

cpp 复制代码

#include <stdio.h>
#include <stdlib.h>

#define MALLOC(num, type) (type*)malloc(num * sizeof(int))
int main()
{
	int* p = MALLOC(10, int);//类型作为参数

	预处理器替换之后
	int* p = (int*)malloc(10 * sizeof(int));
}

不过很少会这样

总结宏和函数的对比：

属性	#define定义宏	函数
代码长度	每次使用时，宏代码都会被插入到程序中。除了非常小的宏之外，程序的长度会大幅度增长	函数代码只出现于一个地方；每次使用这个函数时，都调用那个地方的同一份代码
执行速度	更快	存在函数的调用和返回的额外开销，所以相对慢一些
操作符优先级	宏参数的求值是在所有周围表达式的上下文环境里，除非加上括号，否则邻近操作符的优先级可能会产生不可预料的后果，所以建议宏在书写的时候多些括号	函数参数只在函数调用的时候求值一次，它的结果值传递给函数。表达式的求值结果更容易预测。
带有副作用的参数	参数可能被替换到宏体中的多个位置，所以带有副作用的参数求值可能会产生不可预料的结果。	函数参数只在传参的时候求值一次，结果更容易控制。
参数的类型	宏的参数与类型无关，只要对参数的操作是合法的，它就可以使用于任何参数类型。	函数的参数是与类型有关的，如果参数的类型不同，就需要不同的函数，即使他们执行的任务是相同的。
调试	不方便调试	可以逐语句调试
递归	不可以递归	可以递归

3.2.7 命名约定

一般来讲函数的宏的使用语法很相似。所以语言本身没法帮我们区分二者。那我们平时的一个习惯是：

把宏名全部大写
函数名不要全部大写

3.3 #undef

用于移除一个宏定义。

【样例】

3.4 命令行定义

命令行定义建议在gcc环境下使用。

【代码样例】

cpp 复制代码

#include <stdio.h>

int main()
{
	// 不知道sz是多少
	int arr[sz];
	for (int i = 0; i < sz; i++)
	{
		arr[i] = i;
	}
	for (int i = 0; i < sz; i++)
	{
		printf("%d ", arr[i]);
	}
	return 0;
}

其中，sz的大小只能在编译的时候定义。其指令为：

cpp 复制代码

// 假设定义的大小为10
gcc -D sz=10 test.c

而sz的替换也是在预处理阶段完成的

3.5 条件编译

在编译一个程序的时候我们如果要将一条语句（一组语句）编译或者放弃是很方便的。因为我们有条件编译指令。

常见的条件编译指令：

cpp 复制代码

1、#if 常量表达式
//...
#endif
//常量表达式由预处理器求值。
如：
#define __DEBUG__ 1
#if __DEBUG__
	//..
#endif

2.多个分支的条件编译
#if 常量表达式
	//...
#elif 常量表达式
	//...
#else
	//...
#endif

3.判断是否被定义
#if defined(symbol)
#ifdef symbol
#if !defined(symbol)
#ifndef symbol

4.嵌套指令
#if defined(OS_UNIX)
	#ifdef OPTION1
		unix_version_option1();
	#endif
	#ifdef OPTION2
		unix_version_option2();
	#endif
#elif defined(OS_MSDOS)
	#ifdef OPTION2
		msdos_version_option2();
	#endif
#endif

【代码样例】

cpp 复制代码

#include <stdio.h>
#define PRINT

int main()
{
	// 只要ifdef后的值又被定义就为真
#ifdef PRINT
	printf("hello world1\n");

	//#ifdef和#endif是一对的
#endif

	// 没有被定义就为假
#ifdef X
	printf("hello world2\n");
#endif

	return 0;
}

【输出结果】

【预处理阶段】

3.6 文件包含

3.6.1 头文件被包含的方式：

自定义头文件包含

cpp 复制代码

#include "filename"

查找策略：先在源文件所在目录下查找，如果该头文件未找到，编译器就像查找库函数头文件一样在标准位置查找头文件。如果找不到就提示编译错误。

库文件包含

cpp 复制代码

#include <filename.h>

查找策略：查找头文件直接去库所在的路径下去查找，如果找不到就提示编译错误。

这样是不是可以说，对于库文件也可以使用双引号的形式包含？

答案是：可以的。但是这样做查找的效率就低些（用双引号先在源文件所在目录下查找，然后才会在库所在路径下查找），当然这样也不容易区分是库文件还是本地文件了。但自定义文件只能用双引号

3.6.2 嵌套文件包含

如果出现这样的场景：

comm.h和comm.c是公共模块。
test1.h和test1.c使用了公共模块。
test2.h和test2.c使用了公共模块。
test.h和test.c使用了test1模块和test2模块。

这样最终程序中就会出现两份comm.h的内容。这样就造成了文件内容的重复

那如何解决上述问题呢？ --- 条件编译。

每个头文件的开头写：

cpp 复制代码

// __TEST_H__名字可以随便取

#ifndef __TEST_H__
#define __TEST_H__
//这里是头文件的内容
#endif

或者

cpp 复制代码

#pragma once

注意：对于库函数，它底层就已经把#pragma once加上了，不需要使用者操心。

【笔试题】

头文件中的ifndef/define/endif是干什么用的?

--- 防止头文件被重复多次包含的
#include <filename.h>和#include "filename.h"有什么区别?

--- 尖括号的查找方式是直接去库对应的头文件目录去查；而对于双引号是首先区项目所在路径查找，如果找不到，再去标准库目录下查找，如果两次都找不到，则报错。

【C语言】程序环境和预处理

目录

一、程序的翻译环境和执行环境

二、详解编译 + 链接（重点）

2.1 翻译环境

2.2 细分编译的几个阶段

2.3 运行环境

三、预处理详解

3.1 预定义符号

3.2 #define（重点 ）

3.2.1 #define 定义标识符

3.2.2 #define 定义宏

2.2.3 #define 替换规则

3.2.4 #和##

3.2.5 带副作用的宏参数

3.2.6 宏和函数对比

3.2.7 命名约定

3.3 #undef

3.4 命令行定义

3.5 条件编译

3.6 文件包含

3.6.1 头文件被包含的方式：

3.6.2 嵌套文件包含

3.2 #define（重点）