Linux：库制作与原理（四）

动态链接不神秘------GOT/PLT 让 .so 真正跑起来

关键词：动态库、ldd、LD_LIBRARY_PATH、ldconfig、GOT、PLT、PIC

适合：总被 "error while loading shared libraries" 折磨的人

1.动态库 vs 静态库：本质差异是"什么时候把代码放进来"

静态库 .a：编译链接时 把库代码塞进可执行文件，运行时不依赖 .a
动态库 .so：可执行文件里通常只记录"需要哪些符号/入口"，运行时由系统把库映射进内存并完成符号解析

你可以用 ldd 看依赖关系：

ldd main.exe

输出会列出依赖的共享库，以及动态链接器（例如 /lib64/ld-linux-x86-64.so.2）

2.经典报错：`libxxx.so => not found` 怎么办？

当 ldd a.out 显示 libmystdio.so => not found，说明运行时找不到库。解决方向就三类：

方案 A：把 `.so` 放进系统共享库目录

常见：/usr/lib、/usr/local/lib、/lib64 等。

方案 B：配置搜索路径 + 更新缓存（推荐更规范）

在 /etc/ld.so.conf.d/ 新增配置文件，写入你的库目录，然后运行：

ldconfig

系统会更新 /etc/ld.so.cache，动态链接器加载更快。

方案 C：临时用环境变量（开发调试常用）

export LD_LIBRARY_PATH=/your/so/path:$LD_LIBRARY_PATH

3.程序真正从哪开始跑？不是 main，是 `_start`

很多人以为执行文件一运行就进 main()，但实际上入口点是 _start。它会做一堆"你感觉不到"的初始化：

初始化栈
初始化数据段（复制 data、清零 bss）
关键：调用动态链接器完成依赖库加载、符号解析与重定位
再调用 __libc_start_main，最终才进入 main

这也是为什么 ldd 输出里会出现 ld-linux：它就是动态链接器。

4.代码段只读，那动态链接怎么"改地址"？

这就引出灵魂问题：

运行时要把外部函数地址修正到正确位置，可 .text（代码段）一般是只读的，怎么改？

答案：不改代码段，改 GOT 表。

GOT（Global Offset Table）

GOT 通常位于 .data 可写区域：专门存放"外部函数/全局变量的真实地址"。动态链接器在加载库后，把 GOT 里的条目填成正确地址。

你能在 readelf -S a.out 里看到 .got，并且它在加载时往往会和 .data/.bss 合到同一个可写 segment。

5.PIC：为什么编译动态库要 `-fPIC`？

动态库需要被加载到"任意位置"，所以内部不能写死绝对地址；它依赖相对寻址 + GOT 来定位外部符号，这就是 PIC（Position Independent Code）。

典型 Makefile 写法是：

编译 .o：gcc -fPIC -c ...
链接 .so：gcc -shared -o libxxx.so ...

6.PLT：为啥第一次调用慢，后面就快了？

如果程序启动就把所有外部函数都解析完，成本太高。于是引入 延迟绑定（lazy binding），常见机制就是 PLT（Procedure Linkage Table）+ GOT：

第一次调用某个外部函数：先跳到 PLT 的"桩代码"，由它去解析真实地址并写回 GOT
后续调用：直接从 GOT 拿到真实地址，直接跳转

这就是你常听到的："第一次调用慢一些，后面就稳了"。

7.你真正掌握动态链接的标志：能把这 4 件事讲清楚

系统怎么找 .so （目录、LD_LIBRARY_PATH、ldconfig 缓存）
加载从 _start 开始，动态链接器参与早期初始化
GOT 解决可写重定位 （不碰只读 .text）
PLT 做延迟绑定，把"解析开销"推迟到第一次调用