重写 GCC 内联汇编以不需要 volatile 或内存破坏器

Rewriting GCC inline assembly to not require volatile or a memory clobber

是否可以重写或改进此函数以在其内联汇编中不需要 volatile 或通用内存破坏器?

// do stuff with the input Foo structure and write the result to the 
// output Bar structure.
static inline void MemFrob(const struct Foo* input, struct Bar* output) {
    register const Foo* r0 asm("r0") = input;
    register Bar* r1 asm("r1") = output;

    __asm__ __volatile__(
        "svc #0x0f0000 \n\t"
        : "+r" (r0), "+r" (r1)
        :
        : "r2", "r3", "cc", "memory"
        );
}

针对这个具体情况,目标平台是ARM7系统,代码是用GCC 5.3.0编译的。正在执行的系统调用与 C 函数调用具有相同的调用约定。经过反复试验,我得出了上面的 "works" 但我还不确定它是否正确并且会始终有效,这取决于优化编译器的突发奇想和幻想。

我希望能够删除 "memory" 破坏并准确地告诉 GCC 将修改哪些内存,但是 GCC Extended Asm 文档讨论了如何将值分配给特定的寄存器,然后是内存限制,但如果它们都可以组合则不是。截至目前,从上面的示例中删除 "memory" clobber 可能会导致 GCC 在后续代码中不使用输出。

我还希望能够在不使用输出的情况下删除 volatile。但是到目前为止,从上面的示例中删除 volatile 会导致 GCC 根本不发出程序集。

手动添加额外的内联程序集以将系统调用参数移动到 r0/r1 或通过将代码移动到外部编译单元来取消内联是我宁愿避免的浪费的解决方法。

长话短说:这就是 "m" 约束的用途。通常,如果您使用 volatile__volatile__asm,那是因为您的代码中存在错误。编译器的主要工作之一是流分析,所以只要你给它足够的信息来进行正确的流分析,一切都会正常工作。

这里是固定版本:

void MemFrob(const struct Foo* input, struct Bar* output) {
    register const Foo* r0 asm("r0") = input;
    register Bar* r1 asm("r1") = output;
    __asm__ (
        "svc #0x0f0000"
        : "=m"(*r1) // writes data to *output (but does not read)
        : "m"(*r0), // reads data in *input
          "l"(r0), "l"(r1) // This is necessary to ensure correct register
        : "r2", "r3", "cc"
        );
}

您可以在 https://gcc.godbolt.org/ 上测试它(推荐 -O2 编译器选项)。输出结果如下:

svc #0x0f0000
bx lr

显然,在内联时,它应该减少到只有一条指令。

不幸的是,除了上面的方法有点笨拙之外,我不知道如何在使用内联ARM汇编时指定特定的寄存器。