Linux：库制作与原理（三）

适合：想真正搞懂"编译/链接在干啥"的你，话不多说，我们正式开始啦

在 Linux 下，我们常用 gcc 把源码编译成目标文件（.o），再把多个 .o 链接成可执行程序。一个很实际的好处是：改了哪个源文件，只需要重编它对应的 .o，不必把整个工程重来一遍

最典型的演示是两个源文件：

hello.c代码

cpp 复制代码

#include <stdio.h>

int main()
{
    printf("hello linux\n");
    func();
}

code.c代码

复制代码

#include <stdio.h>

void func()
{
    printf("hello func\n");
}

分别编译：

gcc -c hello.c gcc -c code.c ls # code.o hello.o

此时 .o 就是"目标文件"。你可以用 file 看它是什么类型：

file hello.o # ELF 64-bit LSB relocatable...

目标文件本质是 ELF 的一种形式：可重定位文件（Relocatabl e）

ELF（Executable and Linkable Format）不止可执行文件才用，常见四类都属于 ELF：

理解 ELF 的关键不是背字段，而是抓住它的两个"视角"：

链接器更关心 section：.text/.data/.rodata/.bss/.symtab 等等。比如：

查看 section：

readelf -S a.out

操作系统加载程序时，更关心 segment（段）。段是加载单位：哪些要映射进内存、权限是什么（R/W/X），这些信息记录在 Program Header Table 里。

查看 segment：

readelf -l a.out

你会看到典型的 LOAD 段：

一句话：为了省内存、方便权限管理。

如果 .text、.init 等小节各占一页（比如 4KB），碎片会非常多；合并成 segment 后能减少浪费。同时把"可执行"和"可写"等权限隔离开，更安全。

你用 objdump -d hello.o 反汇编时，可能会看到 call 的跳转地址像"空的"（例如全 0）。原因是：编译阶段并不知道外部符号（比如 printf、另一个文件里的 run）最终会放到哪里。

那怎么解决？

靠链接阶段：链接器会根据重定位信息 与符号表把这些地址修正好。

你可以用 readelf -s 看符号表，会看到 UND（未定义）：

readelf -s hello.o # ... puts UND # ... run UND

链接完成后（比如 gcc *.o -o main.exe），再看符号表会发现 run 已经有了地址，说明链接把它"对上了"。

到这里，你就不是"只会 gcc 一把梭"的选手了，下篇博客见啦~~