为什么用-fpic和-pie编译的程序会重定位Table?

Why does a Program Compiled with -fpic and -pie Have Relocation Table?

如果一个简单的程序是用下面的命令编译的:

arm-none-eabi-gcc -shared -fpic -pie --specs=nosys.specs simple.c -o simple.exe

并且使用命令打印重定位条目:

arm-none-eabi-readelf simple.exe -r

有一堆重定位条目部分(见下文)。

由于 -fpic / -pie 标志导致编译器生成与位置无关的 executable,我天真的(而且显然是错误的)假设是不需要重定位 table 因为加载程序可以毫无问题地将 executable 图像放置在任何地方。那么为什么那里有一个重定位 table,这是否表明代码实际上不是位置独立的?

Relocation section '.rel.dyn' at offset 0x82d4 contains 37 entries:
 Offset     Info    Type            Sym.Value  Sym. Name
000084a8  00000017 R_ARM_RELATIVE   
000084d0  00000017 R_ARM_RELATIVE   
00008508  00000017 R_ARM_RELATIVE   
00008510  00000017 R_ARM_RELATIVE   
0000855c  00000017 R_ARM_RELATIVE   
00008560  00000017 R_ARM_RELATIVE   
00008564  00000017 R_ARM_RELATIVE   
00008678  00000017 R_ARM_RELATIVE   
0000867c  00000017 R_ARM_RELATIVE   
0000870c  00000017 R_ARM_RELATIVE   
00008710  00000017 R_ARM_RELATIVE   
00008714  00000017 R_ARM_RELATIVE   
00008718  00000017 R_ARM_RELATIVE   
00008978  00000017 R_ARM_RELATIVE   
000089dc  00000017 R_ARM_RELATIVE   
000089e0  00000017 R_ARM_RELATIVE   
00008abc  00000017 R_ARM_RELATIVE   
00008ae4  00000017 R_ARM_RELATIVE   
00018af4  00000017 R_ARM_RELATIVE   
00018af8  00000017 R_ARM_RELATIVE   
00018afc  00000017 R_ARM_RELATIVE   
00018c04  00000017 R_ARM_RELATIVE   
00018c08  00000017 R_ARM_RELATIVE   
00018c0c  00000017 R_ARM_RELATIVE   
00018c34  00000017 R_ARM_RELATIVE   
00019028  00000017 R_ARM_RELATIVE   
000084cc  00000c02 R_ARM_ABS32       00000000   __libc_fini
0000850c  00000602 R_ARM_ABS32       00000000   __deregister_frame_inf
00008558  00001302 R_ARM_ABS32       00000000   __register_frame_info
00008568  00001202 R_ARM_ABS32       00000000   _Jv_RegisterClasses
00008664  00000d02 R_ARM_ABS32       00000000   __stack
00008668  00000a02 R_ARM_ABS32       00000000   hardware_init_hook
0000866c  00000802 R_ARM_ABS32       00000000   software_init_hook
00008670  00000502 R_ARM_ABS32       0001902c   __bss_start__
00008674  00000702 R_ARM_ABS32       00019048   __bss_end__
0000897c  00001402 R_ARM_ABS32       00000000   free
00008ac0  00000402 R_ARM_ABS32       00000000   malloc

Relocation section '.rel.plt' at offset 0x83fc contains 4 entries:
 Offset     Info    Type            Sym.Value  Sym. Name
00018be8  00000416 R_ARM_JUMP_SLOT   00000000   malloc
00018bec  00000616 R_ARM_JUMP_SLOT   00000000   __deregister_frame_inf
00018bf0  00001316 R_ARM_JUMP_SLOT   00000000   __register_frame_info
00018bf4  00001416 R_ARM_JUMP_SLOT   00000000   free

一个 executable 由几个 部分 组成。 虽然实际实施细节有所不同,但大致可分为四组:

  1. Read-Only Executable代码,也称为"Text"
  2. 只读常量数据(全局常量)
  3. (已初始化)读写数据(带初始值设定项的全局变量)
  4. 未初始化的读写数据(其他全局变量,初始化为0)

非位置无关代码包含大量对函数地址、全局变量和全局常量的引用。

只读数据和初始化读写数据有时包含对函数地址、全局变量和全局常量的引用:

int x;
int *y = &x; // y needs a relocation.

加载器可以根据重定位重定位代码,只有两个问题:

  1. 重定位在程序启动/库加载时需要时间
  2. 如果我们重新定位,我们现在在 RAM 中修改了文本段的 copy,这对于加载我们库的每个进程都是不同的,所以我们会浪费 RAM .

现在是真正的答案: PIC 旨在通过摆脱 text 重定位来解决上述问题,而不是摆脱所有重定位。

只读数据和初始化数据的重定位相对较少,所以(1.)和(2.)通常都不是问题。我们甚至不关心 (2.) 的读写数据,因为无论如何我们都需要为每个进程提供单独的副本。 事实上,编译器没有办法使数据位置无关,因为如果你要求全局 int* y = &x; 那么编译器别无选择,只能将指针放在那里。

现在,如何使代码与位置无关? 这取决于平台,但它通常涉及一些相对低效的操作,或者处理器对更有效的指令中使用的最大偏移量施加任意限制,以便以与位置无关的方式访问数据和代码。此外,动态链接意味着某些函数的地址甚至不被称为相对偏移量。 因此,编译器倾向于使用包含实际地址的 table,代码将从 table 中查找实际地址。 tables,在不同平台上被称为 GOT、TOC、PLT 以及其他一些名称,很可能是具有大量重定位的常量数据。

如果无法避免搬迁,我们的想法是将它们全部放在一个地方,以尽量减少问题 (1.) 和 (2.)。