如何在物理内存中避免共享库文本部分的多个副本?

How are multiple copies of shared library text section avoided in physical memory?

当Linux加载共享库时,我的理解是,文本部分只加载到物理内存中一次,然后映射到引用它的不同进程的页表。

但是where/whoensures/checks同一个共享库文本段没有被多次加载到物理内存中?

加载程序或 mmap() 系统调用是否避免了重复,或者是否有其他方法以及如何避免?

编辑1: 我一定已经展示了到目前为止所做的事情(研究)。这是...

试图跟踪一个简单的睡眠命令。

$ strace sleep 100 &
[1] 22824
$ execve("/bin/sleep", ["sleep", "100"], [/* 26 vars */]) = 0
brk(0)                                  = 0x89bd000
access("/etc/ld.so.preload", R_OK)      = -1 ENOENT (No such file or directory)
open("/etc/ld.so.cache", O_RDONLY)      = 3
fstat64(3, {st_mode=S_IFREG|0644, st_size=92360, ...}) = 0
mmap2(NULL, 92360, PROT_READ, MAP_PRIVATE, 3, 0) = 0xb7f56000
close(3)                                = 0
open("/lib/libc.so.6", O_RDONLY)        = 3
read(3, "7ELF[=10=][=10=][=10=][=10=][=10=][=10=][=10=][=10=][=10=][=10=][=10=][=10=][=10=][=10=][=10=]`G[=10=]04[=10=][=10=][=10=]"..., 512) = 512
mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb7f55000
fstat64(3, {st_mode=S_IFREG|0755, st_size=1706232, ...}) = 0
mmap2(0x460000, 1426884, PROT_READ|PROT_EXEC, MAP_PRIVATE|MAP_DENYWRITE, 3, 0) = 0x460000
mmap2(0x5b7000, 12288, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_FIXED|MAP_DENYWRITE, 3, 0x156) = 0x5b7000
mmap2(0x5ba000, 9668, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_FIXED|MAP_ANONYMOUS, -1, 0) = 0x5ba000
close(3)                                = 0
mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb7f54000
...
munmap(0xb7f56000, 92360)               = 0
...

然后检查了这个进程的 /proc/pid/maps 文件;

$ cat /proc/22824/maps
00441000-0045c000 r-xp 00000000 fd:00 2622360    /lib/ld-2.5.so
...
00460000-005b7000 r-xp 00000000 fd:00 2622361    /lib/libc-2.5.so
...
00e3e000-00e3f000 r-xp 00e3e000 00:00 0          [vdso]
08048000-0807c000 r-xp 00000000 fd:00 5681559    /usr/bin/strace
...

这里可以看出,libc.so.6 和 PROT_READ|PROT_EXEC 的 mmap2() 的 addr 参数位于特定地址。这让我相信物理内存中的共享库映射是由加载程序以某种方式管理的。

共享库由mmap()系统调用加载,Linux内核很智能。它有一个内部数据结构,它将文件描述符(包含挂载实例和 inode 编号)映射到其中的映射页面。

动态链接器(它的代码在某处/lib/ld-linux.so或类似的地方)只使用这个mmap()调用来映射库(然后重新定位它们的符号表),这个页面级重复数据删除就完成了完全由内核。

映射发生在 PROT_READ|PROT_EXEC|PROT_SHARED 标志上,您可以通过跟踪任何工具(如 strace /bin/echo)轻松检查。