编译器gcc/g++ --【Linux基础开发工具】

文章目录

一、背景知识
二、gcc编译选项
三、动态链接和静态链接
四、静态库和动态库
[五、gcc其他常用选项 - 了解即可](#五、gcc其他常用选项 - 了解即可)

一、背景知识

预处理（进行宏替换/去注释/条件编译/头文件展开等)
编译（生成汇编)
汇编（生成机器可识别代码）
连接（生成可执行文件或库文件)

二、gcc编译选项

格式 gcc [选项] 要编译的文件 [选项] [目标文件]

1、预处理(进行宏替换)

• 预处理功能主要包括: 宏定义,文件包含,条件编译,去注释等。

• 预处理指令是以 # 号开头的代码行。

• 实例: gcc --E hello.c --o hello.i

• 选项 "-E" ,该选项的作用是让 gcc 在预处理结束后停止编译过程。

• 选项 "-o" 是指目标文件, ".i" 文件为已经过预处理的C原始程序。

2、编译（生成汇编）

• 在这个阶段中,gcc 首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后, gcc 把代码翻译成汇编语言。

• 用户可以使用"-S"选项来进行查看,该选项只进行编译而不进行汇编,生成汇编代码。

• 实例: gcc --S hello.i --o hello.s

3、汇编（生成机器可识别代码）

• 汇编阶段是把编译阶段生成的".s"文件转成目标文件

• 读者在此可使用选项"-c"就可看到汇编代码已转化为".o"的二进制目标代码了

• 实例: gcc --c hello.s --o hello.o

4、链接（生成可执行文件或库文件）

• 在成功编译之后,就进入了链接阶段。

• 实例: gcc hello.o --o hello

三、动态链接和静态链接

在我们的实际开发中，不可能将所有代码放在一个源文件中，所以会出现多个源文件，而且多个源文件之间不是独立的，而会存在多种依赖关系，如一个源文件可能要调用另一个源文件中定义的函数，但是每个源文件都是独立编译的，即每个*.c文件会形成一个*.o文件，为了满足前面说的依赖关系，则需要将这些源文件产生的目标文件进行链接，从而形成一个可以执行的程序。这个链接的过程就是静态链接。

静态链接的缺点很明显：

• 浪费空间：因为每个可执行程序中对所有需要的目标文件都要有一份副本，所以如果多个程序对同一个目标文件都有依赖，如多个程序中都调用了printf()函数，则这多个程序中都含有printf.o，所以同一个目标文件都在内存存在多个副本；

• 更新比较困难：因为每当库函数的代码修改了，这个时候就需要重新进行编译链接形成可执行程序。但是静态链接的优点就是，在可执行程序中已经具备了所有执行程序所需要的任何东西，在执行的时候运行速度快。

动态链接的出现解决了静态链接中提到问题。动态链接的基本思想是把程序按照模块拆分成各个相对独立部分，在程序运行时才将它们链接在一起形成一个完整的程序，而不是像静态链接一样把所有程序模块都链接成一个单独的可执行文件。

动态链接其实远比静态链接要常用得多。比如我们查看下 hello 这个可执行程序依赖的动态库，会发现它就用到了一个c动态链接库：

bash 复制代码

$ ldd hello
		linux-vdso.so.1 => (0x00007fffeb1ab000) 
		libc.so.6 => /lib64/libc.so.6 (0x00007ff776af5000) 
		/lib64/ld-linux-x86-64.so.2 (0x00007ff776ec3000)
# ldd命令用于打印程序或者库文件所依赖的共享库列表。

在这里涉及到一个重要的概念: 库

• 我们的C程序中，并没有定义"printf"的函数实现,且在预编译中包含的"stdio.h"中也只有该函数的声明,而没有定义函数的实现,那么,是在哪里实"printf"函数的呢?

• 最后的答案是:系统把这些函数实现都被做到名为 libc.so.6 的库文件中去了,在没有特别指定时,gcc 会到系统默认的搜索路径"/usr/lib"下进行查找,也就是链接到libc.so.6 库函数中去,这样就能实现函数"printf"了,而这也就是链接的作用

四、静态库和动态库

1、动静态库

• 静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不再需要库文件了。其后缀名一般为".a"

• 动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时由运行时链接文件加载库,这样可以节省系统的开销。动态库一般后缀名为".so",如前面所述的 libc.so.6 就是动态库。gcc 在编译时默认使用动态库。完成了链接之后,gcc 就可以生成可执行文件,如下所示。 gcc hello.o --o hello

• gcc默认生成的二进制程序，是动态链接的，这点可以通过 file 命令验证。

📌 注意：

• Linux下，动态库XXX.so, 静态库XXX.a

• Windows下，动态库XXX.dll, 静态库XXX.lib

一般我们的云服务器，C/C++的静态库并没有安装，可以采用如下方法安装

bash 复制代码

# Centos
yum install glibc-static libstdc++-static -y
#ubuntu
略(apt)

2、编译器自举

编译器自举（Bootstrapping）是指通过现有的编译工具来构建新的编译器的过程，尤其是指用目标语言本身编写的新编译器。这个过程的核心思想在于"自我宿主"------即一个高级语言程序可以用来编译其自身的源代码。

自举的基本步骤

初始阶段：从零开始创建一个小规模、功能有限的编译器版本A0。它可以将一小部分核心语法结构翻译为目标机器码或其他中间表示形式。
迭代改进：利用现有编译器（可能是手工编写的简单解释器或者是另一种成熟语言提供的编译系统），把更复杂的特性逐步加入到新编译器中，并能够处理更多的语言特性和优化技术。此时会产生一个新的编译器版本A1。
循环增强：随着每一轮迭代，编译器的功能越来越强大，直到它能完全理解和转换整个预期的目标语言为止。最终得到的就是全功能版的编译器An，而该编译器已经可以用自身生成的二进制文件来进行后续更新和发展了。
验证一致性：为了保证质量，在每次升级过程中都需要进行严格的测试，确保每个新版本都能正确解析并编译旧版本所支持的所有合法输入。
独立运行：一旦成功完成所有轮次的迭代并且经过充分调试之后，就可以移除对原始辅助编译环境的需求，使得最终产物成为一个独立运作的产品。

实际案例

许多现代编程语言都是采用这种方式发展的，例如GCC (GNU Compiler Collection) 的开发就是基于C/C++本身的；还有像Python这样的脚本语言也经历了类似的发展路径，其中CPython实现了Python标准库以及解释器的主要组成部分。

五、gcc其他常用选项 - 了解即可

• -E 只激活预处理,这个不生成文件,你需要把它重定向到一个输出文件里面

• -S 编译到汇编语言不进行汇编和链接

• -c 编译到目标代码

• -o 文件输出到文件

• -static 此选项对生成的文件采用静态链接

• -g 生成调试信息。GNU 调试器可利用该信息。

• -shared 此选项将尽量使用动态库，所以生成文件比较小，但是需要系统由动态库.

• -O0

• -O1

• -O2

• -O3 编译器的优化选项的4个级别，-O0表示没有优化,-O1为缺省值，-O3优化级别最高

• -w 不生成任何警告信息。

• -Wall 生成所有警告信息。