ELF文件中动态链接的过程 | Keep your passion for what you love !

ELF文件中动态链接的过程

2026-03-17 17:02:49 #动态链接 # 二进制安全

前言

本文开头首先介绍一下编译文件使用所使用的动态链接和静态链接的差异，再详细讲解一下动态链接的过程。一般使用的二进制程序都是动态链接的，因为其文件更小，节省内存，所以重心是放在动态链接上。^[1]

静态和动态链接文件的差异

在 Linux/Unix 系统里，可执行文件（ELF 格式居多）可以分为两种：

静态链接：所有依赖的库代码在编译时都被复制到可执行文件里，运行时不依赖外部库。
动态链接：可执行文件只包含“符号引用”，运行时由动态链接器（ld.so / ld-linux.so）把需要的库加载到进程内存空间，然后把函数地址解析好。

动态链接的好处是：

节省内存（多个进程共享同一个 .so 库副本）；
节省磁盘空间；
更新库更方便（比如升级 libc.so，所有程序都能受益）。

编译后文件的差异

动态链接一般比静态链接的文件大。静态链接其将库函数都写在了ELF文件中，所以编译后的文件比较大。动态链接只是将要用到的库函数标记一下，用到的时候直接调用，并没有直接写入到ELF文件中。

同样的文件1.c文件：

静态编译：

1	gcc -fno-pie --static -o statest 1.c

动态编译：

1	gcc -fno-pie -no-pie -o dytest 1.c

区别

静态的文件是明显比动态的大的。

动态链接的大致过程

可执行文件如何调用动态库函数？

流程大概分 编译期 和 运行期 两个阶段。

（1）编译/链接阶段

源代码中调用库函数（如 printf("hello\n");）。
编译器编译时，并没有把 printf 的实现放进来，而是生成一个 符号引用。
链接器 (ld) 把可执行文件和动态库的“符号表”关联，但不填充具体地址。
在可执行文件中，会生成 PLT（Procedure Linkage Table） 和 GOT（Global Offset Table） 用于后续跳转。

📌 举例：
在 main 里调用 printf，编译器会让它跳转到 plt[printf]，而不是直接去 libc.so。

（2）运行阶段

运行时由动态链接器负责，流程是这样的：

加载 ELF
- 当你执行一个程序，内核的 execve 会加载 ELF 文件，看到它依赖哪些共享库（在 ELF 的 .dynamic 段里）。
- 内核加载程序本体后，把动态链接器（ld.so）也加载到进程空间。内核只负责加载程序本体和动态链接器，具体的共享库查找/加载工作由 ld.so 完成
动态链接器查找库
- 动态链接器会在系统目录（如 /lib, /usr/lib）或 LD_LIBRARY_PATH 指定的路径里找到 libc.so 等库文件。
- 然后把这些库映射（mmap）到进程内存。
符号解析与重定位
- 可执行文件中函数调用是通过 PLT 表。
- 第一次调用某个库函数时，程序跳转到 plt[func]，plt 会间接跳到 got[func]。
- got[func] 最开始指向动态链接器的一个“解析函数”（resolver）。
- 动态链接器（ld.so）查找真正的符号地址（比如 printf 在 libc.so 的偏移），然后回写到 got[func]。
- 之后的调用就可以直接通过 got 跳到 printf，不再需要解析。

这种机制称为 Lazy Binding（延迟绑定），好处是只解析真正用到的符号，提高启动速度。
如果用 LD_BIND_NOW=1 ./a.out，则会启用 Eager Binding，一开始就解析所有符号。

关键数据结构

PLT（Procedure Linkage Table）：保存一段“跳板”代码，程序调用库函数时跳到这里。
GOT（Global Offset Table）：保存函数或全局变量的实际地址。
动态链接器 ld.so：运行时负责加载库、解析符号、做重定位。

动态链接调用printf实际案例

#include <stdio.h>
int main() {
    printf("%s\n", "Hello");
    return 0;
}

编译：

1	gcc -fno-builtin-printf hello.c -o hello

查看依赖：

1 2	ldd hello # 会看到 libc.so.6 是依赖的动态库

查看反汇编：

1 2	objdump -d hello \| grep plt # 可以看到 printf@plt

运行时第一次调用 printf：

main -> printf@plt
plt 通过 got 里的入口跳到动态链接器 resolver
resolver 找到 libc.so 的 printf 实际地址，更新 got
后续 printf 调用直接跳到 libc.so 里的实现

总结

动态链接的可执行文件调用库函数的核心机制是：

编译时 不嵌入库代码，只保留符号引用，生成 PLT/GOT 表。
运行时 动态链接器加载 .so，解析符号，把真实地址写入 GOT。
程序通过 PLT -> GOT -> 实际函数地址 的链路完成调用。

动态链接过程中相关结构

下面这些结构是只有动态链接的程序才有具有。

`.dynamic section`的作用

存储动态链接相关的信息
.dynamic 包含一系列 Elf32_Dyn 或 Elf64_Dyn 结构体，每个结构体称为一个 动态条目（dynamic entry），用来告诉动态链接器如何处理这个 ELF 文件。
内容示例（常见的动态条目）：
- DT_NEEDED：依赖的共享库（比如 libc.so）
- DT_STRTAB：字符串表地址（函数名、库名等）
- DT_SYMTAB：符号表地址
- DT_PLTGOT：指向 .got.plt 的指针
- DT_INIT / DT_FINI：初始化函数、结束函数的地址
- DT_REL / DT_RELA：重定位表
- DT_DEBUG：调试相关的结构（gdb 用）
和 GOT/PLT 的关系
动态链接器（ld.so）在装载 ELF 时，会读取 .dynamic 段，根据里面的条目去解析符号、重定位 GOT/PLT 表项，从而在运行时将函数地址填充到 .got.plt 中。

换句话说：

.dynamic 是一张“说明书”，告诉动态链接器要加载哪些库、符号表在哪、重定位信息在哪。
动态链接器根据 .dynamic 提供的这些信息，去修正（fixup） .got.plt，使得程序调用外部函数时能找到正确的地址。

（这里的“修正”就是指，动态链接器在运行时 把函数的真实地址写入到对应的 .got.plt 表项中，替换掉原本的占位符，这里其实就是修之后，函数调用就可以直接跳转到目标函数的真实地址，而不需要再经过动态解析流程。）

`.got.plt` 的作用

.got.plt 的全称是 Global Offset Table for the Procedure Linkage Table，也就是 PLT 专用的 GOT 表。

.got.plt 属于 .got 表的一部分，而不是 .plt。⚠️⚠️⚠️（注意！！！）

它本质上还是 Global Offset Table (GOT)，只不过是 GOT 里专门留给 PLT 使用的那部分。

主要作用

这部分通常被单独命名为 .got.plt，但它实际上还是 .got 段中的一个子区间。

存放动态链接函数的地址
- 程序调用外部库函数（比如 printf、puts）时，真正的函数地址在编译时是未知的。
- .got.plt 就是用来存放这些函数在运行时的真实地址。
支持延迟绑定（Lazy Binding）
- 一开始 .got.plt 表项指向的是 PLT 的下一条指令（即 plt+6），会触发动态链接器去解析函数地址。
- 当第一次调用某个函数时，动态链接器（ld.so）会解析符号，找到函数在共享库中的实际地址，然后把地址写回 .got.plt 表项。
- 后续再次调用该函数时，程序直接从 .got.plt 里取到真实地址，不需要再调用动态解析器。

流程示例

以 printf() 调用为例：

程序调用 printf@plt → 跳到 .plt 段。
.plt 里第一步会查 .got.plt 里对应的表项。
- 如果是第一次调用，表项指向 __dl_runtime_resolve（动态解析函数）。
- 动态链接器解析 printf 的真实地址。
动态链接器把解析出的 printf 地址写回 .got.plt。
下次再调用 printf@plt，直接跳转到 .got.plt 里的真实地址，不再触发解析。

👉 总结一句话：
.got.plt 就是一张“跳转表”，用来存放外部函数在运行时的真实地址。它配合 .plt 实现了 延迟绑定，让程序在第一次调用时解析地址，后面就能直接调用。

动态解析整个动态链接的过程

假设代码中调用了一个在动态链接库中名为foo的函数，下面使用图演示

进程首次调用foo

这里的.text就是用户写的代码，foo就是我们代码中调用的动态链接库的代码，plt是程序中代码段里的一个保存了解析函数真实地址的一个节^[2]，plt0是plt最开始的两段指令。.got.plt里面保存的数组，它存放的位置是数据段。

首先是.text代码段调用foo函数。

跳转到.plt中的foo表项

跳转到.plt中的foo表项，.plt中的代码立即跳转到.got.plt中记录的地址。

现在执行jmp *(foo@GOT)，跳转到.got.plt的foo@GOT的位置处。

.got.plt中记录的地址

但是foo@GOT里面的内容是foo@plt+6，这个是plt表项下面的代码，又跳回到了plt，并且是跳到了jmp的下面的一行代码。

这里解释一下foo@plt+6，这里的6是6个字节，因为jmp *(foo@GOT)刚好是6个字节，所以说plt+6刚好是跳过了jmp指令了，直接执行push index。

回到.plt,解析foo的实际地址

接下来就是连续要执行的4个汇编代码

push index
jmp  PLT0
push *(GOT+4)
jmp  *(GOT+8)

首先是push index，这里的index指的是调用的第index个外部函数，比如小结的开头，我们演示的图片中是调用了foo函数，foo函数在plt中对应调用的函数是第4个，那么index就是0x4。

再执行jmp PLT0跳转到PLT0。

开始执行push *(GOT+4)。前面说过，一个可执行文件可能会引用不止一个动态链接库，这个汇编代码的作用就是去定位动态链接库，去哪一个动态链接库中去找我们调用的foo函数。

再执行jmp *(GOT+8)代码。前面已经执行了push index和push *(GOT+4)，这两个是为后续解析foo函数真实地址函数提供的参数，接下来就是跳转到解析函数真实地址的函数的位置，即执行jmp *(GOT+8)。

解析foo的真正地址填入.got.plt中

这个解析foo函数真实地址的函数是__dl_runtime_resolve，__dl_runtime_resolve函数解析出foo函数的真正地址，填入到.got.plt中。

此后 .got.plt 中保存的是 foo 的真实地址

第二次调用foo

call foo@plt到plt然后直接跳转到.got.plt中存放foo函数真实地址的地方。

直接自.got.plt跳转到foo的真实地址，没有了第一次的解析地址过程。

整个完整流程总结

真实代码演示动态链接的过程

测试的dylink.c代码：

#include<stdio.h>
#include<stdlib.h>
int main(){
    int x = 0;
    puts("first!");
    x = 1;
    puts("second!");
    printf("once %d\n",x);
    exit(0);
}