x64 函数调用参数 push/mov 顺序 (MSVC)
x64 function call arguments push/mov order (MSVC)
我正在学习 x64 汇编和一个带有 MS VC 工具集的基本示例应用程序。 Microsoft documents 整数和指针变量的前 4 个参数将被压入 RC、RD、R8、R9,其余变量将使用堆栈。我明白这一点,从下面的代码片段、程序集调试来看,它看起来很像,但我无法理解为什么这些没有按顺序完成?在下面的示例中,我期待反汇编出现从右到左顺序 e、d、c、b、a、cp、ip 推送参数,但我看到被推送的是 e、b、a 等。
有人可以解释一下吗? TIA
代码片段
__declspec(noinline) int testArgsAsm(int* x, char* cp, int a, int b, int c, int d, int e)
{
std::cout << *x << *cp;
int sum = a + b + c + d + e;
if (sum == 0)
std::cout << "0";
else
std::cout << "Non 0";
return sum;
}
int main(int argc, const char** args)
{
int a, b, c, d, e;
int* ip = new int; *ip = 0x101;
char* cp = new char; *cp = ('g');
std::cin >> a >> b >> c >> d >> e;
testArgsAsm(ip, cp, a,b,c,d,e);
return 0;
}
Assembly
testArgsAsm(ip, cp, a,b,c,d,e);
00007FF694DB1359 mov eax,dword ptr [e]
00007FF694DB135D mov r9d,dword ptr [b]
00007FF694DB1362 mov r8d,dword ptr [a]
00007FF694DB1367 mov dword ptr [rsp+30h],eax
00007FF694DB136B mov eax,dword ptr [d]
00007FF694DB136F mov dword ptr [rsp+28h],eax
00007FF694DB1373 mov eax,dword ptr [c]
00007FF694DB1377 mov rdx,rbx
00007FF694DB137A mov rcx,rdi
00007FF694DB137D mov dword ptr [rsp+20h],eax
00007FF694DB1381 call testArgsAsm (07FF694DB1270h) <= Instruction pointer
registers at this instant
RAX = 0000000000000003 RBX = 0000025633A16030 RCX = 0000025633A13EC0 RDX = 0000025633A16030
RSI = 0000000000000000 RDI = 0000025633A13EC0 R8 = 0000000000000001 R9 = 0000000000000002
R10 = 000000000000000F R11 = 000000F5016F0001 R12 = 0000000000000000 R13 = 0000000000000000
R14 = 0000000000000000 R15 = 0000000000000000 RIP = 00007FF694DB1381 RSP = 000000F5016FFB00
RBP = 0000000000000000 EFL = 00000202
PS: 这可能是一个菜鸟问题,因为我才刚刚开始学习 asy
I am unable to understand why these are not done in order?
重要的是在 call
的正确寄存器中具有正确的值。他们放在那里的顺序无关紧要。
使用堆栈参数以相反顺序进行的唯一原因是当您使用 push
在存储它们的同时为它们分配堆栈 space。 MSVC 选择不这样做,而是使用 mov
,因此(除了可能的性能差异之外)只要每个参数都写入正确的位置,它在内存中写入参数的顺序就会产生零差异。
这个调用者已经为 args 保留了 space + 32 字节影子 space(如果需要,寄存器 args 可以被被调用者溢出以形成一个 args 数组),所以它使用 mov
而不是 push
.
函数首先使用它们的第一个参数的情况并不少见,因此 首先在调用者中设置它可能会避免延迟瓶颈,并且意味着乱序执行不必看起来像当前端开始从被调用函数发出指令时,很难找到输入就绪 的指令。 (http://agner.org/optimize/).
或者简单地说,编译器从左到右解析函数参数并最终发出按该顺序运行的 asm。
我正在学习 x64 汇编和一个带有 MS VC 工具集的基本示例应用程序。 Microsoft documents 整数和指针变量的前 4 个参数将被压入 RC、RD、R8、R9,其余变量将使用堆栈。我明白这一点,从下面的代码片段、程序集调试来看,它看起来很像,但我无法理解为什么这些没有按顺序完成?在下面的示例中,我期待反汇编出现从右到左顺序 e、d、c、b、a、cp、ip 推送参数,但我看到被推送的是 e、b、a 等。 有人可以解释一下吗? TIA
代码片段
__declspec(noinline) int testArgsAsm(int* x, char* cp, int a, int b, int c, int d, int e)
{
std::cout << *x << *cp;
int sum = a + b + c + d + e;
if (sum == 0)
std::cout << "0";
else
std::cout << "Non 0";
return sum;
}
int main(int argc, const char** args)
{
int a, b, c, d, e;
int* ip = new int; *ip = 0x101;
char* cp = new char; *cp = ('g');
std::cin >> a >> b >> c >> d >> e;
testArgsAsm(ip, cp, a,b,c,d,e);
return 0;
}
Assembly
testArgsAsm(ip, cp, a,b,c,d,e);
00007FF694DB1359 mov eax,dword ptr [e]
00007FF694DB135D mov r9d,dword ptr [b]
00007FF694DB1362 mov r8d,dword ptr [a]
00007FF694DB1367 mov dword ptr [rsp+30h],eax
00007FF694DB136B mov eax,dword ptr [d]
00007FF694DB136F mov dword ptr [rsp+28h],eax
00007FF694DB1373 mov eax,dword ptr [c]
00007FF694DB1377 mov rdx,rbx
00007FF694DB137A mov rcx,rdi
00007FF694DB137D mov dword ptr [rsp+20h],eax
00007FF694DB1381 call testArgsAsm (07FF694DB1270h) <= Instruction pointer
registers at this instant
RAX = 0000000000000003 RBX = 0000025633A16030 RCX = 0000025633A13EC0 RDX = 0000025633A16030
RSI = 0000000000000000 RDI = 0000025633A13EC0 R8 = 0000000000000001 R9 = 0000000000000002
R10 = 000000000000000F R11 = 000000F5016F0001 R12 = 0000000000000000 R13 = 0000000000000000
R14 = 0000000000000000 R15 = 0000000000000000 RIP = 00007FF694DB1381 RSP = 000000F5016FFB00
RBP = 0000000000000000 EFL = 00000202
PS: 这可能是一个菜鸟问题,因为我才刚刚开始学习 asy
I am unable to understand why these are not done in order?
重要的是在 call
的正确寄存器中具有正确的值。他们放在那里的顺序无关紧要。
使用堆栈参数以相反顺序进行的唯一原因是当您使用 push
在存储它们的同时为它们分配堆栈 space。 MSVC 选择不这样做,而是使用 mov
,因此(除了可能的性能差异之外)只要每个参数都写入正确的位置,它在内存中写入参数的顺序就会产生零差异。
这个调用者已经为 args 保留了 space + 32 字节影子 space(如果需要,寄存器 args 可以被被调用者溢出以形成一个 args 数组),所以它使用 mov
而不是 push
.
函数首先使用它们的第一个参数的情况并不少见,因此 首先在调用者中设置它可能会避免延迟瓶颈,并且意味着乱序执行不必看起来像当前端开始从被调用函数发出指令时,很难找到输入就绪 的指令。 (http://agner.org/optimize/).
或者简单地说,编译器从左到右解析函数参数并最终发出按该顺序运行的 asm。