__libc_start_main@plt 是如何工作的?

how __libc_start_main@plt works?

为了研究linux中的object文件如何加载和运行,我做了最简单的c代码,文件名simple.c.

int main(){}

接下来,我制作目标文件并将目标文件保存为文本文件。

$gcc ./simple.c 
$objdump -xD ./a.out > simple.text

从许多互联网文章中,我发现 gcc 动态加载启动函数,如 _start、_init、__libc_start_main@plt 等。所以在 http://dbp-consulting.com/tutorials/debugging/linuxProgramStartup.html 的帮助下,我开始阅读我的汇编代码。

下面是部分汇编代码。

080482e0 <__libc_start_main@plt>:
 80482e0:       ff 25 10 a0 04 08       jmp    *0x804a010
 80482e6:       68 08 00 00 00          push   [=13=]x8
 80482eb:       e9 d0 ff ff ff          jmp    80482c0 <_init+0x2c>

Disassembly of section .text:

080482f0 <_start>:
 80482f0:       31 ed                   xor    %ebp,%ebp
 80482f2:       5e                      pop    %esi
 80482f3:       89 e1                   mov    %esp,%ecx
 80482f5:       83 e4 f0                and    [=13=]xfffffff0,%esp
 80482f8:       50                      push   %eax
 80482f9:       54                      push   %esp
 80482fa:       52                      push   %edx
 80482fb:       68 70 84 04 08          push   [=13=]x8048470
 8048300:       68 00 84 04 08          push   [=13=]x8048400
 8048305:       51                      push   %ecx
 8048306:       56                      push   %esi
 8048307:       68 ed 83 04 08          push   [=13=]x80483ed
 804830c:       e8 cf ff ff ff          call   80482e0 <__libc_start_main@plt>
 8048311:       f4                      hlt
 8048312:       66 90                   xchg   %ax,%ax
 8048314:       66 90                   xchg   %ax,%ax
 8048316:       66 90                   xchg   %ax,%ax
 8048318:       66 90                   xchg   %ax,%ax
 804831a:       66 90                   xchg   %ax,%ax
 804831c:       66 90                   xchg   %ax,%ax
 804831e:       66 90                   xchg   %ax,%ax

080483ed <main>:
 80483ed:       55                      push   %ebp
 80483ee:       89 e5                   mov    %esp,%ebp
 80483f0:       b8 00 00 00 00          mov    [=13=]x0,%eax
 80483f5:       5d                      pop    %ebp
 80483f6:       c3                      ret
 80483f7:       66 90                   xchg   %ax,%ax
 80483f9:       66 90                   xchg   %ax,%ax
 80483fb:       66 90                   xchg   %ax,%ax
 80483fd:       66 90                   xchg   %ax,%ax
 80483ff:       90                      nop



 ...

Disassembly of section .got:

08049ffc <.got>:
 8049ffc:       00 00                   add    %al,(%eax)
        ...

Disassembly of section .got.plt:

0804a000 <_GLOBAL_OFFSET_TABLE_>:
 804a000:       14 9f                   adc    [=13=]x9f,%al
 804a002:       04 08                   add    [=13=]x8,%al
        ...
 804a00c:       d6                      (bad)
 804a00d:       82                      (bad)
 804a00e:       04 08                   add    [=13=]x8,%al
 804a010:       e6 82                   out    %al,[=13=]x82
 804a012:       04 08                   add    [=13=]x8,%al

我的问题是;

在0x804830c中调用了0x80482e0(前面的指令我已经看懂了)。

在0x80482e0,进程跳转到0x804a010。

在0x804a010中,指令为

...等等。刚出去? %al 中有什么,0x82 在哪里?我卡在这一行了。

请帮忙....

*p.s。我是 linux 和操作系统的初学者。我在学校学习操作系统概念 class,但仍然找不到如何学习正确的 linux 汇编语言。我已经下载了英特尔处理器手册,但它太大了,无法阅读。谁能告诉我好material对我来说?谢谢。

80482e0:       ff 25 10 a0 04 08       jmp    *0x804a010

这意味着"retrieve the 4-byte address stored at 0x804a010 and jump to it."

804a010:       e6 82                   out    %al,[=11=]x82
804a012:       04 08                   add    [=11=]x8,%al

这4个字节将被视为地址,0x80482e6,而不是指令。

80482e0:       ff 25 10 a0 04 08       jmp    *0x804a010
80482e6:       68 08 00 00 00          push   [=12=]x8
80482eb:       e9 d0 ff ff ff          jmp    80482c0 <_init+0x2c>

所以我们刚刚执行了一条指令,它使我们正好向前移动了一条指令。此时,您可能想知道这样做是否有充分的理由。

有。这是一个典型的 PLT/GOT 实现。 Position Independent Code in shared libraries: The Procedure Linkage Table.

上有更多详细信息,包括图表

__libc_start_main 的真实代码在共享库 glibc 中。编译器和编译时链接器不知道代码在 运行 时的位置,因此它们在编译后的程序中放置了一个简短的 __libc_start_main 函数,它只包含三个指令:

  • 跳转到GOT中第4个(或第5个,取决于你喜欢从0还是1开始计数)条目指定的位置
  • 将 $8 压入堆栈
  • 跳转到解析器例程

第一次调用 __libc_start_main 时,解析器代码将 运行。它将在共享库中找到 __libc_start_main 的实际位置,并将 GOT 的第 4 个条目修补为该地址。如果你的程序再次调用__libc_start_mainjmp *0x804a010指令将把程序直接带到共享库中的代码。

Can anyone inform me good material for me?

Wikibooks 上的 x86 Assembly 一本书可能是一个起点。