Return 从非 void 函数末尾掉落时写入未使用参数的值

Return value from writing an unused parameter when falling off the end of a non-void function

在这个 golfing answer 中,我看到了一个技巧,其中 return 值是未传入的第二个参数。

int f(i, j) 
{
    j = i;   
}

int main() 
{
    return f(3);
}

gcc's assembly output 看来,当代码复制 j = i 时,它会将结果存储在 eax 中,恰好是 return 值。

f:
        pushq   %rbp
        movq    %rsp, %rbp
        movl    %edi, -4(%rbp)
        movl    %esi, -8(%rbp)
        movl    -4(%rbp), %eax
        movl    %eax, -8(%rbp)
        nop
        popq    %rbp
        ret
main:
        pushq   %rbp
        movq    %rsp, %rbp
        movl    , %edi
        movl    [=12=], %eax
        call    f
        popq    %rbp
        ret 

所以,这只是运气好吗?这是gcc记录的吗?它只适用于 -O0,但它适用于 i 我尝试过的一堆值,-m32,以及一堆不同版本的 GCC。

gcc -O0 喜欢计算 return 值寄存器中的表达式,if 根本需要一个寄存器。(GCC -O0 通常只喜欢在 retval 寄存器中有值,但这超出了将其选为第一个临时寄存器的范围。)

我测试了一下,看起来 GCC -O0 确实有意跨多个 ISA 执行此操作,有时甚至使用额外的 mov 指令或等效指令。 IIRC 我使表达式更复杂,因此评估结果最终在另一个寄存器中,但它仍然将其复制回 retval 寄存器。

x++ 这样可以(在 x86 上)编译为内存目标 inc 或 add 的东西不会将值留在寄存器中,但赋值通常会。所以请注意,GCC 正在处理像 GNU C statement-expressions.

这样的函数体

没有任何文件记录、保证或标准化。这是一个实现细节,而不是让你像这样利用的东西。

以这种方式“返回”一个值意味着您正在使用“GCC -O0”而不是 C 进行编程。代码高尔夫规则的措辞表明程序必须至少在一个实现上工作。但我的解读是它们应该 出于正确的原因 而不是因为某些副作用实现细节。他们在 clang 上崩溃不是因为 clang 不支持某些语言功能,只是因为它们甚至不是用 C 语言编写的。

在启用优化的情况下破解也不酷;某种级别的 UB 在代码高尔夫中通常是可以接受的,例如整数环绕或指针转换类型的双关语是人们可能合理希望定义明确的东西。但这纯粹是滥用一个编译器的实现细节,而不是语言功能。

我在 the relevant answer on Codegolf.SE C golfing tips Q&A 下的评论中争论了这一点(错误地声称它可以在 GCC 之外工作)。这个答案有 4 个反对票(在 IMO 上值得更多),但有 16 个赞成票。所以一些社区成员不同意这是可怕和愚蠢的。


有趣的事实:在 ISO C++(但不是 C)中,在非 void 函数的末尾执行失败是未定义的行为,即使调用者 使用结果 。即使在 GNU C++ 中也是如此;在 -O0 之外 GCC 和 clang 有时会发出类似 ud2(非法指令)的代码,用于到达函数末尾但没有 return 的执行路径。所以 GCC 通常不会在这里定义行为(对于 ISO C 和 C++ 未定义的事情,哪些实现允许执行。例如 gcc -fwrapv 将有符号溢出定义为 2 的补码环绕。)

但是 在 ISO C 中,从非 void 函数的末尾脱落是合法的:只有当调用者使用 return 值 时它才会变成 UB。如果没有 -Wall,GCC 甚至可能不会发出警告。 Checking return value of a function without return statement

禁用优化后,将不会发生函数内联,因此 UB 并不是真正的编译时可见的。 (除非你使用 __attribute__((always_inline)))。


传递第二个参数只会给你东西分配给。它是一个函数 arg 并不重要。但是 i=i; 即使使用 -O0 也会进行优化,因此您确实需要一个单独的变量。也只是 i; 优化掉。

有趣的事实:递归 f(i){ f(i); } 函数体在将其复制到第一个 arg 传递寄存器之前通过 EAX 反弹 i。所以 GCC 真的很喜欢 EAX。

        movl    -4(%rbp), %eax
        movl    %eax, %edi
        movl    [=10=], %eax             # without a full prototype, pass # of FP args in AL
        call    f

i++; 没有载入 EAX;它只是使用一个内存目标 add 而没有加载到寄存器中。值得尝试使用 gcc -O0 for ARM。