移植 AT&T inline-asm inb / outb 包装器以与 gcc -masm=intel 一起工作

Porting AT&T inline-asm inb / outb wrappers to work with gcc -masm=intel

我目前正在开发我的 x86 OS。我尝试从 here 实现 inb 函数,它给了我 Error: Operand type mismatch for `in'.

这也可能与outbio_wait相同。

我正在使用 Intel 语法 (-masm=intel),但我不知道该怎么做。

代码:

#include <stdint.h>
#include "ioaccess.h"

uint8_t inb(uint16_t port)
{
    uint8_t ret;
    asm volatile ( "inb %1, %0"
                   : "=a"(ret)
                   : "Nd"(port) );
    return ret;
}

使用 AT&T 语法这确实有效。


对于 outb,我在反转操作数后遇到了不同的问题:

void io_wait(void)
{
    asm volatile ( "outb [=11=]x80, %0" : : "a"(0) );
}

Error: operand size mismatch for `out'

如果您需要使用 -masm=intel,您需要确保您的内联汇编使用 Intel 语法。 Intel 语法是 dst, src(AT&T 语法是相反的)。这有点 related answer 有一些关于 NASM 的英特尔变体 1 (不是 GAS 的变体)和 AT&T 语法之间的一些差异的有用信息:

Information on how you can go about translating NASM Intel syntax to GAS's AT&T syntax can be found in this Whosebug Answer, and a lot of useful information is provided in this IBM article.

[snip]

In general the biggest differences are:

  • With AT&T syntax the source is on the left and destination is on the right and Intel is the reverse.
  • With AT&T syntax register names are prepended with a %
  • With AT&T syntax immediate values are prepended with a $
  • Memory operands are probably the biggest difference. NASM uses [segment:disp+base+index*scale] instead of GAS's syntax of segment:disp(base, index, scale).

您的代码中的问题是源操作数和目标操作数必须与您使用的原始 AT&T 语法相反。此代码:

asm volatile ( "inb %1, %0"
               : "=a"(ret)
               : "Nd"(port) );

需要:

asm volatile ( "inb %0, %1"
               : "=a"(ret)
               : "Nd"(port) );

关于您的更新:问题是在 Intel 语法中,立即值没有前缀 $。这行有问题:

asm volatile ( "outb [=12=]x80, %0" : : "a"(0) );

应该是:

asm volatile ( "outb 0x80, %0" : : "a"(0) );

如果您有合适的 outb 函数,您可以改为执行以下操作:

#include <stdint.h>
#include "ioaccess.h"

uint8_t inb(uint16_t port)
{
    uint8_t ret;
    asm volatile ( "inb %0, %1"
                   : "=a"(ret)
                   : "Nd"(port) );
    return ret;
}

void outb(uint16_t port, uint8_t byte)
{
    asm volatile ( "outb %1, %0"
                   :
                   : "a"(byte),
                     "Nd"(port) );
}

void io_wait(void)
{
    outb (0x80, 0);
}

稍微复杂一点的版本,同时支持 AT&T 和 Intel dialects:

Multiple assembler dialects in asm templates On targets such as x86, GCC supports multiple assembler dialects. The -masm option controls which dialect GCC uses as its default for inline assembler. The target-specific documentation for the -masm option contains the list of supported dialects, as well as the default dialect if the option is not specified. This information may be important to understand, since assembler code that works correctly when compiled using one dialect will likely fail if compiled using another. See x86 Options.

If your code needs to support multiple assembler dialects (for example, if you are writing public headers that need to support a variety of compilation options), use constructs of this form:

{ dialect0 | dialect1 | dialect2... }

在 x86 和 x86-64 目标上有两种方言。 Dialect0 是 AT&T 语法,Dialect1 是 Intel 语法。这些功能可以这样重新设计:

#include <stdint.h>
#include "ioaccess.h"

uint8_t inb(uint16_t port)
{
    uint8_t ret;
    asm volatile ( "inb {%[port], %[retreg] | %[retreg], %[port]}"
                   : [retreg]"=a"(ret)
                   : [port]"Nd"(port) );
    return ret;
}

void outb(uint16_t port, uint8_t byte)
{
    asm volatile ( "outb {%[byte], %[port] | %[port], %[byte]}"
                   :
                   : [byte]"a"(byte),
                     [port]"Nd"(port) );
}

void io_wait(void)
{
    outb (0x80, 0);
}

我还给出了约束符号名称,而不是使用 %0%1 以使内联程序集更易于阅读和维护。从 GCC 文档中,每个约束都有以下形式:

[ [asmSymbolicName] ] constraint (cvariablename)

其中:

asmSymbolicName

Specifies a symbolic name for the operand. Reference the name in the assembler template by enclosing it in square brackets (i.e. ‘%[Value]’). The scope of the name is the asm statement that contains the definition. Any valid C variable name is acceptable, including names already defined in the surrounding code. No two operands within the same asm statement can use the same symbolic name.

When not using an asmSymbolicName, use the (zero-based) position of the operand in the list of operands in the assembler template. For example if there are three output operands, use ‘%0’ in the template to refer to the first, ‘%1’ for the second, and ‘%2’ for the third.

无论您使用 -masm=intel 还是 -masm=att 选项

进行编译,此版本都应该可以工作2

脚注

  • 1尽管 NASM Intel 方言和 GAS 的(GNU 汇编程序)Intel 语法相似,但仍有一些差异。一个是 NASM Intel 语法使用 [segment:disp+base+index*scale] 可以在 [] 内指定段,GAS 的 Intel 语法需要段外的段:[disp+base+index*scale].
  • 2虽然代码可以运行,但您应该将所有这些基本功能直接放在 ioaccess.h 文件中,并从 .c 文件中删除它们包含它们。因为您将这些基本函数放在单独的 .c 文件(外部链接)中,所以编译器无法尽可能地优化它们。您可以将函数修改为 static inline 类型,然后将它们直接放在 header 中。然后,编译器将能够通过消除函数调用开销和减少额外加载和存储的需要来优化代码。您将希望使用高于 -O0 的优化进行编译。考虑 -O2-O3
  • 关于OS发展的特别说明
    1. 有很多玩具 OSes(示例、教程和 even 代码 OSDev Wiki) that do not work with optimizations on. Many failures are due to bad/poor inline assembly 或使用未定义的行为。内联汇编应该用作最后的手段。如果你的内核没有 运行 优化,它可能不是编译器中的错误(可能只是不太可能)。
    2. 注意@PeterCordes 回答中有关可能触发 DMA 读取的端口访问的建议。

可以编写有或没有 -masm=intel 的代码,使用 GNU C 内联 asm 的方言替代 https://gcc.gnu.org/onlinedocs/gcc/Extended-Asm.html(这是个好主意因为 headers 其他人可能会包括。)

它的工作方式类似于 "{at&t stuff | intel stuff}":编译器根据当前模式选择 | 的哪一侧保留。

AT&T 与 Intel 语法之间的主要区别在于 operand-list 是相反的,所以通常你有类似 "inb {%1,%0 | %0,%1}".

的东西

这是@MichaelPetch 使用方言替代的不错功能的一个版本:

// make this a header: these single instructions can inline more cheaply
// than setting up args for a function call
#include <stdint.h>

static inline
uint8_t inb(uint16_t port)
{
    uint8_t ret;
    asm volatile ( "inb {%1, %0 | %0, %1}"
                   : "=a"(ret)
                   : "Nd"(port) );
    return ret;
}

static inline
void outb(uint16_t port, uint8_t byte)
{
    asm volatile ( "outb {%1, %0 | %0, %1}"
                   :
                   : "a"(byte),
                     "Nd"(port) );
}

static inline
void io_wait(void) {
    outb (0x80, 0);
}

Linux/Glibc sys/io.h 宏有时使用 %w1 将约束扩展到 16 位寄存器名称,但使用大小合适的类型也可以。

如果您想要这些的 memory-barrier 版本以利用 in / out(或多或少)像 locked 一样序列化这一事实指令或 mfence,添加 "memory" 破坏以停止 compile-time 重新排序内存访问。

如果端口 I/O 可以触发对您最近写入的其他内存的 DMA 读取您可能还需要一个 "memory" 破坏 。 (x86 有 cache-coherent DMA,所以你不必明确地刷新它,但你不能让编译器在 outb 之后重新排序它,甚至优化掉一个明显死掉的存储。)


GAS 不支持保存旧模式,因此在您的内联 asm 中使用 .intel_syntax noprefix 会让您不知道是否要切换回 .att_syntax

但这通常是不够的:您需要让编译器在填充模板时以与语法模式匹配的方式格式化操作数。例如端口号需要扩展为 $imm%dx (AT&T1) 与没有 [=30 的 dximm =] 前缀.

或对于内存操作数,[rdi + rax*4 + 8]8(%rdi, %rax, 4)

但是你仍然需要自己处理 { | } 反转操作数列表;编译器不会尝试为你做那件事。纯粹是按照简单的规则text-substitution进入模板

脚注 1:AT&T 反汇编 objdump -d 奇怪地使用 (%dx) 作为 non-immediate 形式的端口号,但 GAS 接受 %dx(%dx)在输入上,因此可以使用 "Nd" 约束,只需扩展到裸寄存器名称即可。