__libc_start_main@plt 是如何工作的?
how __libc_start_main@plt works?
为了研究linux中的object文件如何加载和运行,我做了最简单的c代码,文件名simple.c.
int main(){}
接下来,我制作目标文件并将目标文件保存为文本文件。
$gcc ./simple.c
$objdump -xD ./a.out > simple.text
从许多互联网文章中,我发现 gcc 动态加载启动函数,如 _start、_init、__libc_start_main@plt 等。所以在 http://dbp-consulting.com/tutorials/debugging/linuxProgramStartup.html 的帮助下,我开始阅读我的汇编代码。
下面是部分汇编代码。
080482e0 <__libc_start_main@plt>:
80482e0: ff 25 10 a0 04 08 jmp *0x804a010
80482e6: 68 08 00 00 00 push [=13=]x8
80482eb: e9 d0 ff ff ff jmp 80482c0 <_init+0x2c>
Disassembly of section .text:
080482f0 <_start>:
80482f0: 31 ed xor %ebp,%ebp
80482f2: 5e pop %esi
80482f3: 89 e1 mov %esp,%ecx
80482f5: 83 e4 f0 and [=13=]xfffffff0,%esp
80482f8: 50 push %eax
80482f9: 54 push %esp
80482fa: 52 push %edx
80482fb: 68 70 84 04 08 push [=13=]x8048470
8048300: 68 00 84 04 08 push [=13=]x8048400
8048305: 51 push %ecx
8048306: 56 push %esi
8048307: 68 ed 83 04 08 push [=13=]x80483ed
804830c: e8 cf ff ff ff call 80482e0 <__libc_start_main@plt>
8048311: f4 hlt
8048312: 66 90 xchg %ax,%ax
8048314: 66 90 xchg %ax,%ax
8048316: 66 90 xchg %ax,%ax
8048318: 66 90 xchg %ax,%ax
804831a: 66 90 xchg %ax,%ax
804831c: 66 90 xchg %ax,%ax
804831e: 66 90 xchg %ax,%ax
080483ed <main>:
80483ed: 55 push %ebp
80483ee: 89 e5 mov %esp,%ebp
80483f0: b8 00 00 00 00 mov [=13=]x0,%eax
80483f5: 5d pop %ebp
80483f6: c3 ret
80483f7: 66 90 xchg %ax,%ax
80483f9: 66 90 xchg %ax,%ax
80483fb: 66 90 xchg %ax,%ax
80483fd: 66 90 xchg %ax,%ax
80483ff: 90 nop
...
Disassembly of section .got:
08049ffc <.got>:
8049ffc: 00 00 add %al,(%eax)
...
Disassembly of section .got.plt:
0804a000 <_GLOBAL_OFFSET_TABLE_>:
804a000: 14 9f adc [=13=]x9f,%al
804a002: 04 08 add [=13=]x8,%al
...
804a00c: d6 (bad)
804a00d: 82 (bad)
804a00e: 04 08 add [=13=]x8,%al
804a010: e6 82 out %al,[=13=]x82
804a012: 04 08 add [=13=]x8,%al
我的问题是;
在0x804830c中调用了0x80482e0(前面的指令我已经看懂了)。
在0x80482e0,进程跳转到0x804a010。
在0x804a010中,指令为
...等等。刚出去? %al 中有什么,0x82 在哪里?我卡在这一行了。
请帮忙....
*p.s。我是 linux 和操作系统的初学者。我在学校学习操作系统概念 class,但仍然找不到如何学习正确的 linux 汇编语言。我已经下载了英特尔处理器手册,但它太大了,无法阅读。谁能告诉我好material对我来说?谢谢。
80482e0: ff 25 10 a0 04 08 jmp *0x804a010
这意味着"retrieve the 4-byte address stored at 0x804a010 and jump to it."
804a010: e6 82 out %al,[=11=]x82
804a012: 04 08 add [=11=]x8,%al
这4个字节将被视为地址,0x80482e6,而不是指令。
80482e0: ff 25 10 a0 04 08 jmp *0x804a010
80482e6: 68 08 00 00 00 push [=12=]x8
80482eb: e9 d0 ff ff ff jmp 80482c0 <_init+0x2c>
所以我们刚刚执行了一条指令,它使我们正好向前移动了一条指令。此时,您可能想知道这样做是否有充分的理由。
有。这是一个典型的 PLT/GOT 实现。 Position Independent Code in shared libraries: The Procedure Linkage Table.
上有更多详细信息,包括图表
__libc_start_main
的真实代码在共享库 glibc
中。编译器和编译时链接器不知道代码在 运行 时的位置,因此它们在编译后的程序中放置了一个简短的 __libc_start_main
函数,它只包含三个指令:
- 跳转到GOT中第4个(或第5个,取决于你喜欢从0还是1开始计数)条目指定的位置
- 将 $8 压入堆栈
- 跳转到解析器例程
第一次调用 __libc_start_main
时,解析器代码将 运行。它将在共享库中找到 __libc_start_main
的实际位置,并将 GOT 的第 4 个条目修补为该地址。如果你的程序再次调用__libc_start_main
,jmp *0x804a010
指令将把程序直接带到共享库中的代码。
Can anyone inform me good material for me?
Wikibooks 上的 x86 Assembly 一本书可能是一个起点。
为了研究linux中的object文件如何加载和运行,我做了最简单的c代码,文件名simple.c.
int main(){}
接下来,我制作目标文件并将目标文件保存为文本文件。
$gcc ./simple.c
$objdump -xD ./a.out > simple.text
从许多互联网文章中,我发现 gcc 动态加载启动函数,如 _start、_init、__libc_start_main@plt 等。所以在 http://dbp-consulting.com/tutorials/debugging/linuxProgramStartup.html 的帮助下,我开始阅读我的汇编代码。
下面是部分汇编代码。
080482e0 <__libc_start_main@plt>:
80482e0: ff 25 10 a0 04 08 jmp *0x804a010
80482e6: 68 08 00 00 00 push [=13=]x8
80482eb: e9 d0 ff ff ff jmp 80482c0 <_init+0x2c>
Disassembly of section .text:
080482f0 <_start>:
80482f0: 31 ed xor %ebp,%ebp
80482f2: 5e pop %esi
80482f3: 89 e1 mov %esp,%ecx
80482f5: 83 e4 f0 and [=13=]xfffffff0,%esp
80482f8: 50 push %eax
80482f9: 54 push %esp
80482fa: 52 push %edx
80482fb: 68 70 84 04 08 push [=13=]x8048470
8048300: 68 00 84 04 08 push [=13=]x8048400
8048305: 51 push %ecx
8048306: 56 push %esi
8048307: 68 ed 83 04 08 push [=13=]x80483ed
804830c: e8 cf ff ff ff call 80482e0 <__libc_start_main@plt>
8048311: f4 hlt
8048312: 66 90 xchg %ax,%ax
8048314: 66 90 xchg %ax,%ax
8048316: 66 90 xchg %ax,%ax
8048318: 66 90 xchg %ax,%ax
804831a: 66 90 xchg %ax,%ax
804831c: 66 90 xchg %ax,%ax
804831e: 66 90 xchg %ax,%ax
080483ed <main>:
80483ed: 55 push %ebp
80483ee: 89 e5 mov %esp,%ebp
80483f0: b8 00 00 00 00 mov [=13=]x0,%eax
80483f5: 5d pop %ebp
80483f6: c3 ret
80483f7: 66 90 xchg %ax,%ax
80483f9: 66 90 xchg %ax,%ax
80483fb: 66 90 xchg %ax,%ax
80483fd: 66 90 xchg %ax,%ax
80483ff: 90 nop
...
Disassembly of section .got:
08049ffc <.got>:
8049ffc: 00 00 add %al,(%eax)
...
Disassembly of section .got.plt:
0804a000 <_GLOBAL_OFFSET_TABLE_>:
804a000: 14 9f adc [=13=]x9f,%al
804a002: 04 08 add [=13=]x8,%al
...
804a00c: d6 (bad)
804a00d: 82 (bad)
804a00e: 04 08 add [=13=]x8,%al
804a010: e6 82 out %al,[=13=]x82
804a012: 04 08 add [=13=]x8,%al
我的问题是;
在0x804830c中调用了0x80482e0(前面的指令我已经看懂了)。
在0x80482e0,进程跳转到0x804a010。
在0x804a010中,指令为
...等等。刚出去? %al 中有什么,0x82 在哪里?我卡在这一行了。
请帮忙....
*p.s。我是 linux 和操作系统的初学者。我在学校学习操作系统概念 class,但仍然找不到如何学习正确的 linux 汇编语言。我已经下载了英特尔处理器手册,但它太大了,无法阅读。谁能告诉我好material对我来说?谢谢。
80482e0: ff 25 10 a0 04 08 jmp *0x804a010
这意味着"retrieve the 4-byte address stored at 0x804a010 and jump to it."
804a010: e6 82 out %al,[=11=]x82
804a012: 04 08 add [=11=]x8,%al
这4个字节将被视为地址,0x80482e6,而不是指令。
80482e0: ff 25 10 a0 04 08 jmp *0x804a010
80482e6: 68 08 00 00 00 push [=12=]x8
80482eb: e9 d0 ff ff ff jmp 80482c0 <_init+0x2c>
所以我们刚刚执行了一条指令,它使我们正好向前移动了一条指令。此时,您可能想知道这样做是否有充分的理由。
有。这是一个典型的 PLT/GOT 实现。 Position Independent Code in shared libraries: The Procedure Linkage Table.
上有更多详细信息,包括图表__libc_start_main
的真实代码在共享库 glibc
中。编译器和编译时链接器不知道代码在 运行 时的位置,因此它们在编译后的程序中放置了一个简短的 __libc_start_main
函数,它只包含三个指令:
- 跳转到GOT中第4个(或第5个,取决于你喜欢从0还是1开始计数)条目指定的位置
- 将 $8 压入堆栈
- 跳转到解析器例程
第一次调用 __libc_start_main
时,解析器代码将 运行。它将在共享库中找到 __libc_start_main
的实际位置,并将 GOT 的第 4 个条目修补为该地址。如果你的程序再次调用__libc_start_main
,jmp *0x804a010
指令将把程序直接带到共享库中的代码。
Can anyone inform me good material for me?
Wikibooks 上的 x86 Assembly 一本书可能是一个起点。