即使我有 clobbers,GCC 也不会在我的内联 asm 函数调用周围推送寄存器
GCC doesn't push registers around my inline asm function call even though I have clobbers
我有一个函数 (C) 可以修改 "ecx"(或任何其他寄存器)
int proc(int n) {
int ret;
asm volatile ("movl %1, %%ecx\n\t" // mov (n) to ecx
"addl , %%ecx\n\t" // add (10) to ecx (n)
"movl %%ecx, %0" /* ret = n + 10 */
: "=r" (ret) : "r" (n) : "ecx");
return ret;
}
现在我想在另一个函数中调用这个函数,该函数在调用 "proc" 函数
之前在 "ecx" 中移动一个值
int main_proc(int n) {
asm volatile ("movl , %%ecx" ::: "ecx"); /// mov (55) to ecx
int ret;
asm volatile ("call proc" : "=r" (ret) : "r" (n) : "ecx"); // ecx is modified in proc function and the value of ecx is not 55 anymore even with "ecx" clobber
asm volatile ("addl %%ecx, %0" : "=r" (ret));
return ret;
}
在此函数中,(55) 被移入 "ecx" 寄存器,然后调用 "proc" 函数(修改 "ecx")。在这种情况下,"proc" 函数必须先压入 "ecx" 并在最后弹出它,但这不会发生!!!!
这是具有 (-O3) 优化级别
的程序集源
proc:
movl %edi, %ecx
addl , %ecx
movl %ecx, %eax
ret
main_proc:
movl , %ecx
call proc
addl %ecx, %eax
ret
为什么 GCC 不打算对 "ecx" 寄存器使用 (push) 和 (pop) ??我也用过 "ecx" clobber !!!!!
您使用的内联汇编完全错误。您的 input/output 约束需要完整描述每个 asm 语句的输入/输出。要在 asm 语句之间获取数据,您必须将其保存在它们之间的 C 变量中。
此外,call
通常在内联 asm 中并不安全,特别是在 System V ABI 的 x86-64 代码中,它会踩到 gcc 可能一直保存东西的红色区域。没有办法对此宣布破坏。您可以先使用 sub 8, %rsp
跳过红色区域,或者您可以像普通人一样从纯 C 进行 调用 以便编译器知道它。 (记住 call
推送一个 return 地址。)你的内联汇编甚至没有意义;你的 proc
需要一个参数,但你没有在调用者中做任何事情来传递一个参数。
proc
中编译器生成的代码也可能破坏了任何其他被调用破坏的寄存器,因此您至少需要在这些寄存器上声明破坏。或者在 asm 中手写整个函数,这样你就知道在 clobbers 中放什么了。
why GCC is not going to use (push) and (pop) for "ecx" register ?? i used "ecx" clobber too !!!!!
一个ecx
clobber告诉GCC这个asm语句破坏了GCC之前在ECX中的任何东西。 在两个单独的 inline-asm 语句中使用 ECX clobber 不会声明它们之间的任何类型的数据依赖性。
它不等同于像
那样声明一个register-asm局部变量
register int foo asm("ecx");
用作第一个和最后一个 asm 语句的 "+r" (foo)
操作数。 (或者更简单地说,您使用 "+c"
约束来制作普通变量 pick ECX)。
从 GCC 的角度来看,您的来源仅意味着约束 + 破坏者告诉它的内容。
int main_proc(int n) {
asm volatile ("movl , %%ecx" ::: "ecx");
// ^^ black box that destroys ECX and produces no outputs
int ret;
asm volatile ("call proc" : "=r" (ret) : "r" (n) : "ecx");
// ^^ black box that can take `n` in any register, and can produce `ret` in any reg. And destroys ECX.
asm volatile ("addl %%ecx, %0" : "=r" (ret));
// ^^ black box with no inputs that can produce a new value for `ret` in any register
return ret;
}
我怀疑您希望最后的 asm 语句是 "+r"(ret)
到 read/write C 变量 ret
而不是告诉 GCC 它是仅输出的。因为您的 asm 使用它作为输入以及输出作为 add
.
的目的地
在您的第二个 asm 语句中添加像 # %%0 = %0 %%1 = %1
这样的注释可能会很有趣,以查看选择了哪些寄存器 "=r"
和 "r"
约束。在 the Godbolt compiler explorer:
# gcc9.2 -O3
main_proc:
movl , %ecx
call proc # %0 = %edi %1 = %edi
addl %ecx, %eax # "=r" happened to pick EAX,
# which happens to still hold the return value from proc
ret
在这个函数内联到其他东西之后,可能不会发生选择 EAX 作为添加目标的意外。或者 GCC 碰巧在 asm 语句之间放置了一些编译器生成的指令。 (asm volatile
是编译时重新排序的障碍,但不是一个障碍。它只会完全停止优化)。
请记住,内联 asm 模板是纯文本替换;要求编译器将操作数填充到注释中与模板字符串中的其他任何地方都没有什么不同。 (Godbolt 默认去除注释行,所以有时将它们附加到其他指令或 nop 上很方便)。
如您所见,这是 64 位代码(n
按照 x86-64 SysV 调用约定到达 EDI,就像您构建代码的方式一样),所以 push %ecx
不会' 可编码。 push %rcx
会。
当然,如果 GCC 实际上想在带有 "ecx"
破坏的 asm 语句之后保留一个值,它只会使用 mov %ecx, %edx
或任何其他不是调用破坏的寄存器在 clobber 列表中。
我有一个函数 (C) 可以修改 "ecx"(或任何其他寄存器)
int proc(int n) {
int ret;
asm volatile ("movl %1, %%ecx\n\t" // mov (n) to ecx
"addl , %%ecx\n\t" // add (10) to ecx (n)
"movl %%ecx, %0" /* ret = n + 10 */
: "=r" (ret) : "r" (n) : "ecx");
return ret;
}
现在我想在另一个函数中调用这个函数,该函数在调用 "proc" 函数
之前在 "ecx" 中移动一个值int main_proc(int n) {
asm volatile ("movl , %%ecx" ::: "ecx"); /// mov (55) to ecx
int ret;
asm volatile ("call proc" : "=r" (ret) : "r" (n) : "ecx"); // ecx is modified in proc function and the value of ecx is not 55 anymore even with "ecx" clobber
asm volatile ("addl %%ecx, %0" : "=r" (ret));
return ret;
}
在此函数中,(55) 被移入 "ecx" 寄存器,然后调用 "proc" 函数(修改 "ecx")。在这种情况下,"proc" 函数必须先压入 "ecx" 并在最后弹出它,但这不会发生!!!! 这是具有 (-O3) 优化级别
的程序集源proc:
movl %edi, %ecx
addl , %ecx
movl %ecx, %eax
ret
main_proc:
movl , %ecx
call proc
addl %ecx, %eax
ret
为什么 GCC 不打算对 "ecx" 寄存器使用 (push) 和 (pop) ??我也用过 "ecx" clobber !!!!!
您使用的内联汇编完全错误。您的 input/output 约束需要完整描述每个 asm 语句的输入/输出。要在 asm 语句之间获取数据,您必须将其保存在它们之间的 C 变量中。
此外,call
通常在内联 asm 中并不安全,特别是在 System V ABI 的 x86-64 代码中,它会踩到 gcc 可能一直保存东西的红色区域。没有办法对此宣布破坏。您可以先使用 sub 8, %rsp
跳过红色区域,或者您可以像普通人一样从纯 C 进行 调用 以便编译器知道它。 (记住 call
推送一个 return 地址。)你的内联汇编甚至没有意义;你的 proc
需要一个参数,但你没有在调用者中做任何事情来传递一个参数。
proc
中编译器生成的代码也可能破坏了任何其他被调用破坏的寄存器,因此您至少需要在这些寄存器上声明破坏。或者在 asm 中手写整个函数,这样你就知道在 clobbers 中放什么了。
why GCC is not going to use (push) and (pop) for "ecx" register ?? i used "ecx" clobber too !!!!!
一个ecx
clobber告诉GCC这个asm语句破坏了GCC之前在ECX中的任何东西。 在两个单独的 inline-asm 语句中使用 ECX clobber 不会声明它们之间的任何类型的数据依赖性。
它不等同于像
那样声明一个register-asm局部变量
register int foo asm("ecx");
用作第一个和最后一个 asm 语句的 "+r" (foo)
操作数。 (或者更简单地说,您使用 "+c"
约束来制作普通变量 pick ECX)。
从 GCC 的角度来看,您的来源仅意味着约束 + 破坏者告诉它的内容。
int main_proc(int n) {
asm volatile ("movl , %%ecx" ::: "ecx");
// ^^ black box that destroys ECX and produces no outputs
int ret;
asm volatile ("call proc" : "=r" (ret) : "r" (n) : "ecx");
// ^^ black box that can take `n` in any register, and can produce `ret` in any reg. And destroys ECX.
asm volatile ("addl %%ecx, %0" : "=r" (ret));
// ^^ black box with no inputs that can produce a new value for `ret` in any register
return ret;
}
我怀疑您希望最后的 asm 语句是 "+r"(ret)
到 read/write C 变量 ret
而不是告诉 GCC 它是仅输出的。因为您的 asm 使用它作为输入以及输出作为 add
.
在您的第二个 asm 语句中添加像 # %%0 = %0 %%1 = %1
这样的注释可能会很有趣,以查看选择了哪些寄存器 "=r"
和 "r"
约束。在 the Godbolt compiler explorer:
# gcc9.2 -O3
main_proc:
movl , %ecx
call proc # %0 = %edi %1 = %edi
addl %ecx, %eax # "=r" happened to pick EAX,
# which happens to still hold the return value from proc
ret
在这个函数内联到其他东西之后,可能不会发生选择 EAX 作为添加目标的意外。或者 GCC 碰巧在 asm 语句之间放置了一些编译器生成的指令。 (asm volatile
是编译时重新排序的障碍,但不是一个障碍。它只会完全停止优化)。
请记住,内联 asm 模板是纯文本替换;要求编译器将操作数填充到注释中与模板字符串中的其他任何地方都没有什么不同。 (Godbolt 默认去除注释行,所以有时将它们附加到其他指令或 nop 上很方便)。
如您所见,这是 64 位代码(n
按照 x86-64 SysV 调用约定到达 EDI,就像您构建代码的方式一样),所以 push %ecx
不会' 可编码。 push %rcx
会。
当然,如果 GCC 实际上想在带有 "ecx"
破坏的 asm 语句之后保留一个值,它只会使用 mov %ecx, %edx
或任何其他不是调用破坏的寄存器在 clobber 列表中。