指令 mov %edi 和 mov %rsi 有什么作用?

What do the instructions mov %edi and mov %rsi do?

我编写了一个基本的 C 程序,它定义了一个整数变量 x,将其设置为零,returns 该变量的值:

#include <stdio.h>

int main(int argc, char **argv) {
    int x;
    x = 0;
    return x;
}

当我使用 objdump 转储目标代码时(使用 gcc 在 Linux X86-64 上编译):

0x0000000000400474 <main+0>:    push   %rbp
0x0000000000400475 <main+1>:    mov    %rsp,%rbp
0x0000000000400478 <main+4>:    mov    %edi,-0x14(%rbp)
0x000000000040047b <main+7>:    mov    %rsi,-0x20(%rbp)
0x000000000040047f <main+11>:   movl   [=11=]x0,-0x4(%rbp)
0x0000000000400486 <main+18>:   mov    -0x4(%rbp),%eax
0x0000000000400489 <main+21>:   leaveq 
0x000000000040048a <main+22>:   retq

我可以看到函数序言,但在我们将地址 0x000000000040047f 处的 x 设置为 0 之前,有两条指令将 %edi 和 %rsi 移入堆栈。这些是做什么用的?

此外,与我们将x设置为0的地方不同,GAS语法中的mov指令没有后缀。

If the suffix is not specified, and there are no memory operands for the instruction, GAS infers the operand size from the size of the destination register operand.

在这种情况下,-0x14(%rsbp)-0x20(%rbp)都是内存操作数吗?它们的大小是多少?因为 %edi 是一个 32 位寄存器,所以 32 位移动到 -0x14(%rsbp) 而因为 %rsi 是一个 64 位寄存器,所以 64 位移动到 %rsi,-0x20(%rbp)?

Purpose of ESI & EDI registers?

基于此和上下文,我不是专家,但我的猜测是这些正在捕获 main() 输入参数。 EDI 采用标准宽度,与 int argc 匹配,而 RSI 采用长,与 char **argv 指针匹配。

在这种简单的情况下,你为什么不直接问你的编译器呢?对于 GCC、clang 和 ICC,有 -fverbose-asm 选项。

main:
    pushq   %rbp    #
    movq    %rsp, %rbp  #,
    movl    %edi, -20(%rbp) # argc, argc
    movq    %rsi, -32(%rbp) # argv, argv
    movl    [=10=], -4(%rbp)    #, x
    movl    -4(%rbp), %eax  # x, D.2607
    popq    %rbp    #
    ret

所以,是的,他们使用 "old" 帧指针方法将 argvargv 保存到堆栈中,因为新架构允许 subtracting/adding from/to直接堆栈指针,从而省略帧指针 (-fomit-frame-pointer).