作者:小康,C/C++ 编程博主
关键词:动态库、.so、soname、LD_PRELOAD、dlopen、ldd、ldconfig、符号查找
每个 Linux 开发者都碰到过这样的文件:
libssl.solibssl.so.3libssl.so.3.0.2三个文件,名字差不多,不知道用哪个。ldd 报错说找不到库,但明明文件就在那里。
或者听说过 LD_PRELOAD 可以"劫持"任何程序的函数调用,但不知道原理。
这些都是动态库机制的一部分,今天一次讲清楚。这篇也是之前 ELF 篇的续集——如果你还记得 PLT/GOT 的惰性绑定,这篇会让你把整个链路彻底打通。
编译 C/C++ 程序时,依赖的库有两种打包方式:
静态库(.a 文件):链接时直接把库的代码复制进可执行文件里,最终产物是一个自包含的二进制。
动态库(.so 文件,Shared Object):链接时只记录"我需要这个库",真正的库代码在运行时才加载。

动态库最大的优势是多个进程可以共享同一份物理内存。系统上 100 个进程都用 libc.so,物理内存里只需要一份 libc 的代码页。这也是 Linux 服务器内存利用率比想象中高的原因之一。
这是最让人迷惑的地方。一个动态库会同时存在三个名字,搞清楚这三个名字,libssl.so.3.0.2 这样的命名就完全看懂了。

用 ls -la 在 /usr/lib/x86_64-linux-gnu/ 下实际看一下:
$ ls -la /usr/lib/x86_64-linux-gnu/libssl*lrwxrwxrwx libssl.so -> libssl.so.3 # linker name → sonamelrwxrwxrwx libssl.so.3 -> libssl.so.3.0.2 # soname → realname-rw-r--r-- libssl.so.3.0.2 # realname,真实文件为什么要分三层?版本兼容的关键在这里。
版本号的语义是:主版本号.次版本号.补丁号
这样就能做到:升级 OpenSSL 从 3.0.2 到 3.0.8,所有链接了 libssl.so.3 的程序自动用上新版本,不需要改任何东西。
这是最常见的报错场景:error while loading shared libraries: libfoo.so.1: cannot open shared object file
明明库文件在那里,为什么找不到?原因是 ld.so(动态链接器)有固定的搜索顺序:
1. LD_PRELOAD 指定的库(最优先,劫持用)2. 可执行文件 ELF 里的 RPATH(编译时写死的路径)3. LD_LIBRARY_PATH 环境变量(临时指定)4. 可执行文件 ELF 里的 RUNPATH5. /etc/ld.so.cache(ldconfig 生成的缓存)6. /lib 和 /usr/lib(系统默认)记住这个顺序,找不到库的问题基本上都能定位:
# 查看程序依赖哪些库,以及是否能找到ldd /usr/bin/ls# 输出示例:# linux-vdso.so.1 (0x00007ffd...)# libselinux.so.1 => /lib/x86_64-linux-gnu/libselinux.so.1 (0x...)# libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x...)# 找不到时:libfoo.so.1 => not found ← 就是这个找不到库的常见解法:
# 方法1:把库放到 /usr/local/lib,然后刷新缓存sudo cp libfoo.so.1 /usr/local/lib/sudo ldconfig # 重新生成 /etc/ld.so.cache# 方法2:临时指定搜索路径export LD_LIBRARY_PATH=/my/custom/lib:$LD_LIBRARY_PATH./myapp# 方法3:编译时写死 rpath(部署时不依赖环境变量)gcc myapp.c -o myapp -L/my/custom/lib -lfoo -Wl,-rpath,/my/custom/lib这是动态库机制里最有意思的一个特性,很多人听说过但没真正用过。
LD_PRELOAD 让你在所有其他库之前加载一个指定的 .so。因为符号查找是"谁先找到用谁",所以 LD_PRELOAD 里的库可以覆盖任何函数——包括 libc 里的 malloc、free、printf。
原理图:符号查找顺序

实际用法举例:用 LD_PRELOAD 实现一个简单的 malloc 监控
// mymalloc.c#define _GNU_SOURCE#include<dlfcn.h>#include<stdio.h>// 拿到原始 malloc 的函数指针staticvoid *(*real_malloc)(size_t) = NULL;void *malloc(size_t size){if (!real_malloc) real_malloc = dlsym(RTLD_NEXT, "malloc"); // 找下一个 mallocvoid *ptr = real_malloc(size);fprintf(stderr, "malloc(%zu) = %p\n", size, ptr);return ptr;}# 编译成动态库gcc -shared -fPIC -o mymalloc.so mymalloc.c -ldl# 注入到任意程序LD_PRELOAD=./mymalloc.so ls# 所有 malloc 调用都会被打印出来不需要修改目标程序的源码,不需要重新编译,任何程序都能这样注入。这是很多内存分析工具(jemalloc、tcmalloc)、性能分析工具(gperftools)的底层原理。
上面说的都是程序启动时自动加载的库。还有一种方式是程序运行中按需加载——插件系统的基础。
#include<dlfcn.h>// 运行时打开一个 .so 文件void *handle = dlopen("./myplugin.so", RTLD_LAZY);if (!handle) {fprintf(stderr, "dlopen: %s\n", dlerror());return;}// 从库里找一个函数符号typedefvoid(*plugin_func_t)(void);plugin_func_t func = (plugin_func_t)dlsym(handle, "plugin_run");if (func) func(); // 调用插件函数dlclose(handle); // 用完关掉dlopen 的第二个参数控制符号解析时机:
RTLD_LAZY:惰性绑定,用到时才解析(和 ELF 里的 PLT/GOT 机制一致)RTLD_NOW:立即解析所有符号,加载时就报错(更安全)插件系统、脚本引擎、数据库扩展——很多大型项目的插件机制本质上就是 dlopen + dlsym 这套。
全流程走一遍,三行命令搞定:
// mathlib.c:库的实现intadd(int a, int b){ return a + b; }intmul(int a, int b){ return a * b; }# 步骤1:编译成动态库# -shared:生成 .so# -fPIC:位置无关代码(必须,否则无法在任意地址加载)# -Wl,-soname,libmath.so.1:设置 sonamegcc -shared -fPIC -Wl,-soname,libmath.so.1 -o libmath.so.1.0.0 mathlib.c# 步骤2:创建软链接ln -s libmath.so.1.0.0 libmath.so.1 # sonameln -s libmath.so.1 libmath.so # linker name# 步骤3:编译使用这个库的程序gcc -o myapp main.c -L. -lmath -Wl,-rpath,.# 验证依赖ldd myapp# libmath.so.1 => ./libmath.so.1 (0x...)# 查看程序依赖的库,以及是否都能找到ldd /path/to/binary# 查看 .so 文件的 sonameobjdump -p libssl.so.3.0.2 | grep SONAME# 查看库里导出了哪些符号(函数名)nm -D libssl.so.3 | grep " T "# T 表示导出的函数# 刷新动态库缓存(安装新库后必做)sudo ldconfig# 查看 ldconfig 缓存里有哪些库ldconfig -p | grep libssl# 查看可执行文件链接了哪些库(ELF 里的 NEEDED 字段)readelf -d myapp | grep NEEDEDQ:-fPIC 是什么意思?不加会怎样?
PIC(Position Independent Code,位置无关代码)。动态库被加载到内存的地址是不确定的,多个进程共享同一份代码时,每个进程的加载地址可能不同。-fPIC 让编译器生成不依赖绝对地址的代码,用相对寻址代替。不加 -fPIC 生成的库无法在不同地址空间共享,链接时会报错。
Q:soname 的版本号代表什么?什么时候需要升主版本?
主版本号代表 ABI 兼容性边界。只要主版本相同,即使库做了更新,已有程序不需要重新编译就能运行。一旦接口有破坏性变更(函数签名改了、结构体布局变了),就必须升主版本号,否则老程序加载新库会崩溃。
Q:LD_PRELOAD 有什么安全限制?
对于设置了 setuid/setgid 位的程序,内核会忽略 LD_PRELOAD。否则普通用户可以用 LD_PRELOAD 劫持 sudo 这类特权程序的函数,造成提权漏洞。
Q:ldd 显示 "not found",但文件明明在 /usr/local/lib,怎么解决?
/usr/local/lib 需要在 /etc/ld.so.conf.d/ 里注册,然后运行 sudo ldconfig 刷新缓存。或者临时用 LD_LIBRARY_PATH 指定路径。直接往 /usr/lib 里放是最粗暴的方法,但会污染系统库目录,不推荐。
Q:dlopen 和程序启动时自动加载有什么区别?
启动时自动加载的库在 ELF NEEDED 字段里,ld.so 在进程启动时统一加载。dlopen 是程序运行时按需加载,可以加载任意路径的 .so,用完可以 dlclose 卸载(只要没有其他引用)。前者用于所有必须的依赖,后者用于可选的插件扩展。
动态库这套机制,把"版本兼容"、"内存共享"、"运行时扩展"三件事用一套简洁的设计全解决了:
.so.1.2.3 的三段版本号 → 让升级库不需要重新编译程序LD_PRELOAD → 不改代码就能替换任意函数,是监控和测试的利器dlopen → 插件系统的基础,按需加载,灵活扩展理解了这些,你不仅能解释"为什么 ldd 找不到库",还能真正看懂 gperftools、jemalloc 这类工具的工作方式,也能自己实现一个简单的插件系统。
觉得有收获,点赞、推荐、转发给有需要的朋友🙏 你的支持是我持续更新的动力!
看懂原理是第一步,能写出工程级别的代码是第二步。如果你想把动态库、ELF、系统编程这些知识真正用起来,可以看看我的C++项目实战课程:
我专门做的一套工业级 C++ 项目实战课程,20+ 个真实可跑的项目,覆盖从并发、网络、内存到存储的完整后端知识体系。不是教学玩具,是你简历上能写的那种。
🧱 并发与同步
理解了信号、锁、线程,下一步就是真正用起来
🌐 网络与 I/O
epoll、Reactor、信号——这些原理组合在一起,就是下面这些项目的底层
⚡性能与内存
写完信号处理,你对内存安全和性能的感觉应该更敏锐了
🗄️存储与数据库
学完文件系统、Page Cache,这些项目你会有不一样的理解
20+ 个项目,每个都是真实工程代码,不是教学玩具。挑你最感兴趣的一个开始,点击查看:👉为什么同样是"学过C++",有人面试碾压,有人开口就怂?差距在这18个C++硬核项目
最近新出的 3 个项目:
Mini-STL项目:SGI STL 源码精华:从内存池到红黑树,我用 C++11 重新实现了一遍
对项目课程感兴趣的朋友,扫码加我,备注「 项目实战 」,项目打包购买有优惠。

基础还没打好的同学,可以从 C 语言 / C++ / Linux 编程快速入门开始,我还有一门专讲新一代 I/O 的 Linux io_uring 课程,感兴趣可以了解下: