如何在 GNU 汇编程序中使用字符串文字作为直接操作数(并将其移动到地址)?
How to use a string literal as an immediate operand (and move it to an address) in GNU assembler?
我的意思是我在 NASM 中写的东西是这样的:
mov dword [0xA0BF17C], ' : )'
我在 GNU 汇编器中尝试过这样的事情:
movd " : )", 0xB8000
movd $" : )", 0xB8000
movd ' : )', 0xB8000
movd " : )", [=11=]xB8000
但是...他们都导致了这个错误:
Error: unbalanced parenthesis in operand 1.
GAS 仅支持将单字符文字作为数字。 UTF-8 多字节单个字符可以,但不能多个单独的字符。您可以 movb $' ', 0xB8000
,但您不想对 4 个字节使用 4 条指令。
您有两个真正的选择:将单字符文字一起转换为数字,或者以十六进制写出。 (两种方式都考虑到 x86 是小端)
# NASM mov eax, "abcd"
movl $'a' + ('b'<<8) + ('c'<<16) + ('d'<<24), 0xB8000
movl [=10=]x64636261, 0xB8000 # or manual ASCII -> hex, little-endian
shift/add 技巧适用于任意字节;你甚至可以制作一个 #define
CPP 宏来完成它(采用 4 个参数)。
使用 EAX 目的地而不是内存(以简化机器代码),反汇编回 GAS Intel 语法(objdump -drwC -Mintel
),我们可以看到它们的组装方式相同(as --32
):
0: b8 61 62 63 64 mov eax,0x64636261
5: b8 61 62 63 64 mov eax,0x64636261
或者用你记忆中的目的地。同样,32 位模式,因为这会导致实模式下的#GP 错误超过具有 0xb8000 偏移量的 64k DS 段限制。
另请注意,机器代码中的立即字节的顺序与将作为数据存储到内存目标的顺序相同。 (如果您使用 NASM mov dst, "abcd"
.
,它们会匹配源代码顺序
a: c7 05 00 80 0b 00 61 62 63 64 mov DWORD PTR ds:0xb8000,0x64636261
与 NASM 不同,GAS 不支持将多字符字符文字作为数字常量。 不支持它们甚至会混淆 GAS 的解析器1! GAS 主要是为组装编译器输出而设计的,编译器不需要这个。
GAS 仅支持(双)引用的多个字符的字符串作为 .ascii
/ .asciz
/ .string8/16/32
的参数,而不支持 .byte
(不像 NASM db
) 或作为指令的直接操作数。
如果支持,x86 AT&T 语法将是 movl $' : )', 0xB8000
.
不是 movd
,直接操作数总是需要 $
.
参见 以了解 NASM 对比 MASM 对比 GAS 与多字符文字。只有 NASM 可以直观地工作。
双引号也不行:mov $"foo", %eax
汇编,但是和mov $foo, %eax
汇编一样——把符号的地址foo
写入寄存器。有关示例,请参阅 。
脚注 1: 因此会出现诸如“不平衡括号”之类的错误,而不是诸如“字符文字包含多个字符”之类的合理错误。
mov $'abcd', %eax
是另一个完全混淆解析器的例子。它将 b
视为局部标签的向后符号引用,如 jmp 1b
在向后方向引用 1:
标签。但是它在这里寻找的标签号是97,即'a'
的ASCII值。这完全是疯子
foo.s: Assembler messages:
foo.s:4: Error: backward ref to unknown label "97:"
foo.s:4: Error: junk `cd44%eax' after expression
foo.s:4: Error: number of operands mismatch for `mov'
所有这些都使用 as --version
= GNU 汇编程序 (GNU Binutils) 2.34.
进行了测试
我的意思是我在 NASM 中写的东西是这样的:
mov dword [0xA0BF17C], ' : )'
我在 GNU 汇编器中尝试过这样的事情:
movd " : )", 0xB8000
movd $" : )", 0xB8000
movd ' : )', 0xB8000
movd " : )", [=11=]xB8000
但是...他们都导致了这个错误:
Error: unbalanced parenthesis in operand 1.
GAS 仅支持将单字符文字作为数字。 UTF-8 多字节单个字符可以,但不能多个单独的字符。您可以 movb $' ', 0xB8000
,但您不想对 4 个字节使用 4 条指令。
您有两个真正的选择:将单字符文字一起转换为数字,或者以十六进制写出。 (两种方式都考虑到 x86 是小端)
# NASM mov eax, "abcd"
movl $'a' + ('b'<<8) + ('c'<<16) + ('d'<<24), 0xB8000
movl [=10=]x64636261, 0xB8000 # or manual ASCII -> hex, little-endian
shift/add 技巧适用于任意字节;你甚至可以制作一个 #define
CPP 宏来完成它(采用 4 个参数)。
使用 EAX 目的地而不是内存(以简化机器代码),反汇编回 GAS Intel 语法(objdump -drwC -Mintel
),我们可以看到它们的组装方式相同(as --32
):
0: b8 61 62 63 64 mov eax,0x64636261
5: b8 61 62 63 64 mov eax,0x64636261
或者用你记忆中的目的地。同样,32 位模式,因为这会导致实模式下的#GP 错误超过具有 0xb8000 偏移量的 64k DS 段限制。
另请注意,机器代码中的立即字节的顺序与将作为数据存储到内存目标的顺序相同。 (如果您使用 NASM mov dst, "abcd"
.
a: c7 05 00 80 0b 00 61 62 63 64 mov DWORD PTR ds:0xb8000,0x64636261
与 NASM 不同,GAS 不支持将多字符字符文字作为数字常量。 不支持它们甚至会混淆 GAS 的解析器1! GAS 主要是为组装编译器输出而设计的,编译器不需要这个。
GAS 仅支持(双)引用的多个字符的字符串作为 .ascii
/ .asciz
/ .string8/16/32
的参数,而不支持 .byte
(不像 NASM db
) 或作为指令的直接操作数。
如果支持,x86 AT&T 语法将是 movl $' : )', 0xB8000
.
不是 movd
,直接操作数总是需要 $
.
参见
双引号也不行:mov $"foo", %eax
汇编,但是和mov $foo, %eax
汇编一样——把符号的地址foo
写入寄存器。有关示例,请参阅
脚注 1: 因此会出现诸如“不平衡括号”之类的错误,而不是诸如“字符文字包含多个字符”之类的合理错误。
mov $'abcd', %eax
是另一个完全混淆解析器的例子。它将 b
视为局部标签的向后符号引用,如 jmp 1b
在向后方向引用 1:
标签。但是它在这里寻找的标签号是97,即'a'
的ASCII值。这完全是疯子
foo.s: Assembler messages:
foo.s:4: Error: backward ref to unknown label "97:"
foo.s:4: Error: junk `cd44%eax' after expression
foo.s:4: Error: number of operands mismatch for `mov'
所有这些都使用 as --version
= GNU 汇编程序 (GNU Binutils) 2.34.