rbp 不允许作为 SIB 基础?
rbp not allowed as SIB base?
我对 x86-64 二进制编码还很陌生。我正在尝试修复一些旧的 "assembler" 代码。
无论如何,我正在尝试做这样的事情(英特尔语法):
mov [rbp+rcx], al
汇编程序当前正在生成:
88 04 0D
但这似乎不是有效的说明。如果我将 SIB 字节中的基数从 rbp
更改为其他寄存器,它就可以正常工作。使其工作的另一种方法是添加一个零字节位移 (88 44 0D 00
)。这似乎发生在其他类似的操作码上。
为什么我不能将 rbp
与 mod=00
一起使用?
有关这些特殊情况的编码表和脚注,另请参阅 https://wiki.osdev.org/X86-64_Instruction_Encoding#32.2F64-bit_addressing_2 或 Intel 的第 2 卷手册。 此答案指出了特殊情况,并讨论了为什么这些设计选择有意义,即他们需要解决什么设计问题。
编码意味着 rbp
是无基址寄存器的转义码(只是 SIB 中的 disp32 或 ModRM 中的 RIP 相对 rel32)。大多数 assemblers assemble [rbp]
变成 [rbp + disp8=0]
.
因为你不需要缩放,所以使用 [rcx + rbp]
来避免需要 disp8=0,因为 rbp
can 做一个索引。
(SS 和 DS 在长模式下总是等价的,所以 base=RBP 意味着 SS 而 base=RCX 意味着使用 DS 段并不重要。)
x86 / x86-64 ModRM寻址模式编码特例
(来自我在 上写的一个答案)。这个问题看起来是复制或移植这一部分的完美地方。
rbp
/r13
不能是没有位移的基址寄存器:编码的意思是:(在 ModRM 中)rel32
(相对于 RIP),或(在 SIB 中)disp32
,没有基址寄存器。 (r13
在 ModRM/SIB 中使用相同的 3 位,所以这个选择通过不让指令长度解码器查看 the REX.B bit 来获得第 4 个基址寄存器位来简化解码。 [r13]
assemble 到 [r13 + disp8=0]
。 [r13+rdx]
assembles 到 [rdx+r13]
(当这是一个选项时,通过交换 base/index 来避免问题)。
rsp
/r12
作为基址寄存器总是需要一个 SIB 字节。 (base=RSP 的 ModR/M 编码是用于发送 SIB 字节信号的转义码,同样,如果 r12
的处理方式不同,更多的解码器将不得不关心 REX 前缀)。
rsp
不能是变址寄存器。这使得编码 [rsp]
成为可能,这比 [rsp + rsp]
更有用。 (英特尔本可以为 32 位寻址模式(386 中的新功能)设计 ModRM/SIB 编码,因此 SIB-with-no-index 只有在 base=ESP 的情况下才有可能。这将使 [eax + esp*4]
成为可能且仅exclude [esp + esp*1/2/4/8]
。但这没有用,所以他们通过使 index=ESP 成为无索引的代码来简化硬件,而不管基数如何。这允许两种冗余方式来编码任何基数或基数 + disp 寻址模式:使用或没有 SIB。)
r12
可以作为变址寄存器。与其他情况不同,这不会影响指令长度解码。此外,它不可能像其他情况那样使用更长的编码来解决。 AMD 希望 AMD64 的寄存器集尽可能正交,因此他们花费一些额外的晶体管来检查 REX.X 作为索引/无索引解码的一部分是有道理的。例如,[rsp + r12*4]
需要 index=r12,因此 r12
不是完全通用的会使 AMD64 成为更糟糕的编译器目标。
0: 41 8b 03 mov eax,DWORD PTR [r11]
3: 41 8b 04 24 mov eax,DWORD PTR [r12] # needs a SIB like RSP
7: 41 8b 45 00 mov eax,DWORD PTR [r13+0x0] # needs a disp8 like RBP
b: 41 8b 06 mov eax,DWORD PTR [r14]
e: 41 8b 07 mov eax,DWORD PTR [r15]
11: 43 8b 04 e3 mov eax,DWORD PTR [r11+r12*8] # *can* be an index
这些也都适用于32位寻址模式;编码是相同的,除了没有 EIP-relative 编码,只有两种冗余方式来编码没有 base 的 disp32。
This seems to happen with other similar opcodes.
r/m 操作数的 ModRM 编码始终相同。有些操作码需要寄存器操作数,有些需要内存,但实际的 ModRM + 可选 SIB + 可选位移是固定的,因此无论指令如何,相同的硬件都可以对其进行解码。
有一些罕见的操作码,如 mov al/ax/eax/rax, [qword absolute_address]
,它们的操作数根本不使用 ModRM 编码,但任何使用相同格式的操作码。
我对 x86-64 二进制编码还很陌生。我正在尝试修复一些旧的 "assembler" 代码。
无论如何,我正在尝试做这样的事情(英特尔语法):
mov [rbp+rcx], al
汇编程序当前正在生成:
88 04 0D
但这似乎不是有效的说明。如果我将 SIB 字节中的基数从 rbp
更改为其他寄存器,它就可以正常工作。使其工作的另一种方法是添加一个零字节位移 (88 44 0D 00
)。这似乎发生在其他类似的操作码上。
为什么我不能将 rbp
与 mod=00
一起使用?
有关这些特殊情况的编码表和脚注,另请参阅 https://wiki.osdev.org/X86-64_Instruction_Encoding#32.2F64-bit_addressing_2 或 Intel 的第 2 卷手册。 此答案指出了特殊情况,并讨论了为什么这些设计选择有意义,即他们需要解决什么设计问题。
编码意味着 rbp
是无基址寄存器的转义码(只是 SIB 中的 disp32 或 ModRM 中的 RIP 相对 rel32)。大多数 assemblers assemble [rbp]
变成 [rbp + disp8=0]
.
因为你不需要缩放,所以使用 [rcx + rbp]
来避免需要 disp8=0,因为 rbp
can 做一个索引。
(SS 和 DS 在长模式下总是等价的,所以 base=RBP 意味着 SS 而 base=RCX 意味着使用 DS 段并不重要。)
x86 / x86-64 ModRM寻址模式编码特例
(来自我在
rbp
/r13
不能是没有位移的基址寄存器:编码的意思是:(在 ModRM 中)rel32
(相对于 RIP),或(在 SIB 中)disp32
,没有基址寄存器。 (r13
在 ModRM/SIB 中使用相同的 3 位,所以这个选择通过不让指令长度解码器查看 the REX.B bit 来获得第 4 个基址寄存器位来简化解码。 [r13]
assemble 到 [r13 + disp8=0]
。 [r13+rdx]
assembles 到 [rdx+r13]
(当这是一个选项时,通过交换 base/index 来避免问题)。
rsp
/r12
作为基址寄存器总是需要一个 SIB 字节。 (base=RSP 的 ModR/M 编码是用于发送 SIB 字节信号的转义码,同样,如果 r12
的处理方式不同,更多的解码器将不得不关心 REX 前缀)。
rsp
不能是变址寄存器。这使得编码 [rsp]
成为可能,这比 [rsp + rsp]
更有用。 (英特尔本可以为 32 位寻址模式(386 中的新功能)设计 ModRM/SIB 编码,因此 SIB-with-no-index 只有在 base=ESP 的情况下才有可能。这将使 [eax + esp*4]
成为可能且仅exclude [esp + esp*1/2/4/8]
。但这没有用,所以他们通过使 index=ESP 成为无索引的代码来简化硬件,而不管基数如何。这允许两种冗余方式来编码任何基数或基数 + disp 寻址模式:使用或没有 SIB。)
r12
可以作为变址寄存器。与其他情况不同,这不会影响指令长度解码。此外,它不可能像其他情况那样使用更长的编码来解决。 AMD 希望 AMD64 的寄存器集尽可能正交,因此他们花费一些额外的晶体管来检查 REX.X 作为索引/无索引解码的一部分是有道理的。例如,[rsp + r12*4]
需要 index=r12,因此 r12
不是完全通用的会使 AMD64 成为更糟糕的编译器目标。
0: 41 8b 03 mov eax,DWORD PTR [r11]
3: 41 8b 04 24 mov eax,DWORD PTR [r12] # needs a SIB like RSP
7: 41 8b 45 00 mov eax,DWORD PTR [r13+0x0] # needs a disp8 like RBP
b: 41 8b 06 mov eax,DWORD PTR [r14]
e: 41 8b 07 mov eax,DWORD PTR [r15]
11: 43 8b 04 e3 mov eax,DWORD PTR [r11+r12*8] # *can* be an index
这些也都适用于32位寻址模式;编码是相同的,除了没有 EIP-relative 编码,只有两种冗余方式来编码没有 base 的 disp32。
This seems to happen with other similar opcodes.
r/m 操作数的 ModRM 编码始终相同。有些操作码需要寄存器操作数,有些需要内存,但实际的 ModRM + 可选 SIB + 可选位移是固定的,因此无论指令如何,相同的硬件都可以对其进行解码。
有一些罕见的操作码,如 mov al/ax/eax/rax, [qword absolute_address]
,它们的操作数根本不使用 ModRM 编码,但任何使用相同格式的操作码。