从源码到二进制:深度拆解 Linux 下 C 程序的编译与链接全流程

1. C 程序的完整编译流程

1.1 预处理(Preprocess)

作用

  • 宏替换

  • 头文件展开

  • 条件编译处理

命令

bash 复制代码
gcc -E code.c -o code.i

1.2 编译(Compile → 汇编)

作用

  • 将 C 代码翻译成汇编代码

命令

bash 复制代码
gcc -S code.i -o code.s

.s:汇编代码文件(人类可读)

1.3 汇编(Assemble → 目标文件)

作用

  • 将汇编代码翻译成机器指令

命令

bash 复制代码
gcc -c code.s -o code.o

特点

  • .o:可重定位目标文件

  • 已是二进制

  • 不可直接执行

  • 类似 Windows 的 .obj

作用

  • 将目标文件与库文件链接成最终程序

命令

bash 复制代码
gcc code.o -o code

2. 多文件编译流程

2.1 单独编译每个源文件

bash 复制代码
gcc -c code1.c
gcc -c code2.c

生成:

bash 复制代码
code1.o
code2.o

2.2 链接多个目标文件

bash 复制代码
gcc code.o code1.o code2.o -o code

如:

text 复制代码
1.c → 1.o
2.c → 2.o
3.c → 3.o
     ↓
    链接
     ↓
    exe

3. 程序运行与依赖库分析

3.1 查看动态依赖 - ldd

bash 复制代码
ldd code

示例输出:

bash 复制代码
libc.so.6 => /lib64/libc.so.6

libc 实际位置

bash 复制代码
/lib64/libc.so.6 -> libc-2.17.so

4. 库的分类

4.1 动态库

动态库的本质:

让公共代码在内存中只存在一份

  • Linux:.so

  • Windows:.dll

4.1 静态库

  • Linux:.a

  • Windows:.lib


5. 条件编译

5.1 命令行定义宏

bash 复制代码
gcc code.c -o code -DM
gcc code.c -o code -DM=100

本质

c 复制代码
#define M 100

➡ 预处理阶段直接修改源码文本

5.2 条件编译的用途

  1. 商业版 / 免费版功能裁剪

  2. Linux 内核裁剪

  3. 不同平台、工具链适配


6. 为什么要先编译成汇编?

原因总结:

  • CPU 只识别二进制

  • 汇编是二进制的助记符

  • 编译器最初由汇编写成(自举)

语言翻译层级

text 复制代码
C/C++/Java → 汇编 → 机器码

7. 动态链接与静态链接

7.1 动态链接(默认方式)

特点

  • 程序不包含库代码

  • 运行时跳转到共享库

  • 多个程序共享一份库

示意

text 复制代码
程序 → libc.so → printf()

优点

  • 程序体积小

  • 节省内存和磁盘

缺点

  • 库缺失 → 程序无法运行

7.2 静态链接

命令

bash 复制代码
gcc code.c -o code-static -static

特点

  • 链接时拷贝库代码进程序

  • 运行时不依赖外部库

  • 文件体积大

验证

bash 复制代码
ldd code-static
# not a dynamic executable

7.3 动态 / 静态链接对比总结

对比项 动态链接 静态链接
程序体积
内存占用
库依赖 必须存在 不需要
共享性
相关推荐
电子云与长程纠缠1 小时前
UE5 两种方式解决Decal Actor贴花拉伸问题
学习·ue5·游戏引擎
Cat_Rocky2 小时前
利用Packet Tracer网络实验
linux·运维·服务器
小白学大数据2 小时前
现代Python爬虫开发范式:基于Asyncio的高可用架构实战
开发语言·爬虫·python·架构
red_redemption2 小时前
自由学习记录(172)
学习·cache line 64b·重用距离
嵌入式×边缘AI:打怪升级日志2 小时前
Linux 驱动实战:SR501 人体红外传感器驱动开发与调试全记录
linux·运维·驱动开发
渔舟小调2 小时前
P19 | 前端加密通信层 pikachuNetwork.js 完整实现
开发语言·前端·javascript
不爱吃炸鸡柳2 小时前
数据结构精讲:树 → 二叉树 → 堆 从入门到实战
开发语言·数据结构
正点原子2 小时前
【正点原子Linux连载】第三章 U-Boot使用 摘自【正点原子】ATK-DLRK3568嵌入式Linux驱动开发指南
linux·运维·驱动开发
网络安全许木2 小时前
自学渗透测试第21天(基础命令复盘与DVWA熟悉)
开发语言·网络安全·渗透测试·php