rbp 不允许作为 SIB 基础?

rbp not allowed as SIB base?

我对 x86-64 二进制编码还很陌生。我正在尝试修复一些旧的 "assembler" 代码。

无论如何,我正在尝试做这样的事情(英特尔语法):

mov    [rbp+rcx], al

汇编程序当前正在生成:

88 04 0D

但这似乎不是有效的说明。如果我将 SIB 字节中的基数从 rbp 更改为其他寄存器,它就可以正常工作。使其工作的另一种方法是添加一个零字节位移 (88 44 0D 00)。这似乎发生在其他类似的操作码上。

为什么我不能将 rbpmod=00 一起使用?

有关这些特殊情况的编码表和脚注,另请参阅 https://wiki.osdev.org/X86-64_Instruction_Encoding#32.2F64-bit_addressing_2 或 Intel 的第 2 卷手册。 此答案指出了特殊情况,并讨论了为什么这些设计选择有意义,即他们需要解决什么设计问题。


编码意味着 rbp 是无基址寄存器的转义码(只是 SIB 中的 disp32 或 ModRM 中的 RIP 相对 rel32)。大多数 assemblers assemble [rbp] 变成 [rbp + disp8=0].

因为你不需要缩放,所以使用 [rcx + rbp] 来避免需要 disp8=0,因为 rbp can 做一个索引。

(SS 和 DS 在长模式下总是等价的,所以 base=RBP 意味着 SS 而 base=RCX 意味着使用 DS 段并不重要。)


x86 / x86-64 ModRM寻址模式编码特例

(来自我在 上写的一个答案)。这个问题看起来是复制或移植这一部分的完美地方。

rbp/r13 不能是没有位移的基址寄存器:编码的意思是:(在 ModRM 中)rel32(相对于 RIP),或(在 SIB 中)disp32,没有基址寄存器。 (r13 在 ModRM/SIB 中使用相同的 3 位,所以这个选择通过不让指令长度解码器查看 the REX.B bit 来获得第 4 个基址寄存器位来简化解码。 [r13] assemble 到 [r13 + disp8=0][r13+rdx] assembles 到 [rdx+r13](当这是一个选项时,通过交换 base/index 来避免问题)。

rsp/r12 作为基址寄存器总是需要一个 SIB 字节。 (base=RSP 的 ModR/M 编码是用于发送 SIB 字节信号的转义码,同样,如果 r12 的处理方式不同,更多的解码器将不得不关心 REX 前缀)。

rsp 不能是变址寄存器。这使得编码 [rsp] 成为可能,这比 [rsp + rsp] 更有用。 (英特尔本可以为 32 位寻址模式(386 中的新功能)设计 ModRM/SIB 编码,因此 SIB-with-no-index 只有在 base=ESP 的情况下才有可能。这将使 [eax + esp*4] 成为可能且仅exclude [esp + esp*1/2/4/8]。但这没有用,所以他们通过使 index=ESP 成为无索引的代码来简化硬件,而不管基数如何。这允许两种冗余方式来编码任何基数或基数 + disp 寻址模式:使用或没有 SIB。)

r12 可以作为变址寄存器。与其他情况不同,这不会影响指令长度解码。此外,它不可能像其他情况那样使用更长的编码来解决。 AMD 希望 AMD64 的寄存器集尽可能正交,因此他们花费一些额外的晶体管来检查 REX.X 作为索引/无索引解码的一部分是有道理的。例如,[rsp + r12*4] 需要 index=r12,因此 r12 不是完全通用的会使 AMD64 成为更糟糕的编译器目标。

   0:   41 8b 03                mov    eax,DWORD PTR [r11]
   3:   41 8b 04 24             mov    eax,DWORD PTR [r12]      # needs a SIB like RSP
   7:   41 8b 45 00             mov    eax,DWORD PTR [r13+0x0]  # needs a disp8 like RBP
   b:   41 8b 06                mov    eax,DWORD PTR [r14]
   e:   41 8b 07                mov    eax,DWORD PTR [r15]
  11:   43 8b 04 e3             mov    eax,DWORD PTR [r11+r12*8] # *can* be an index

这些也都适用于32位寻址模式;编码是相同的,除了没有 EIP-relative 编码,只有两种冗余方式来编码没有 base 的 disp32。


This seems to happen with other similar opcodes.

r/m 操作数的 ModRM 编码始终相同。有些操作码需要寄存器操作数,有些需要内存,但实际的 ModRM + 可选 SIB + 可选位移是固定的,因此无论指令如何,相同的硬件都可以对其进行解码。

有一些罕见的操作码,如 mov al/ax/eax/rax, [qword absolute_address],它们的操作数根本不使用 ModRM 编码,但任何使用相同格式的操作码。