如果我尝试将它指向标签,为什么 x86-assembly (r)si 中的寄存器会移动到自身中?

Why does the register in x86-assembly (r)si get moved into itself if I try to point it to a label?

我想写一个引导加载程序,它只是在屏幕上打印 "Hello World!",我不知道为什么我的字节会混淆。我正在尝试用 AT&T 语法编写它(请不要推荐 Intel 语法)并尝试将代码 from this tutorial 转换为 AT&T 语法。

现在这是我的引导加载程序的相当短的代码:

start:
.code16         #real mode
.text
.org 0x0
.globl _main
_main:
    movw hello, %si
    movb [=10=]x0e, %ah

loophere:
    lodsb
    or %al, %al     #is al==0 ?
    jz halt         #if previous instruction sets zero flag jump to halt
    int [=10=]x10       #run bios interrupt 0x10 (ah is set to 0x0e so a character is displayed)
    jmp loophere


halt:
    cli
    hlt


hello:  .ascii "Hello world![=10=]"


filloop:    
    .fill (510-(.-_main)),1,0   #I hope this works. Fill bootloader with 0's until byte 510


end:
    .word 0xaa55

现在如果我用

编译它
$as -o boot.o boot.as
$ld -Ttext 0x07c00 -o boot.elf boot.o
$objcopy -O binary boot.elf boot.bin

以下命令

$objdump -d boot.elf

给我这个反汇编

Disassembly of section .text:

0000000000007c00 <_main>:
    7c00:   8b 36                   mov    (%rsi),%esi
    7c02:   11 7c b4 0e             adc    %edi,0xe(%rsp,%rsi,4)

0000000000007c06 <loophere>:
    7c06:   ac                      lods   %ds:(%rsi),%al
    7c07:   08 c0                   or     %al,%al
    7c09:   74 04                   je     7c0f <halt>
    7c0b:   cd 10                   int    [=13=]x10
    7c0d:   eb f7                   jmp    7c06 <loophere>

0000000000007c0f <halt>:
    7c0f:   fa                      cli    
    7c10:   f4                      hlt    

0000000000007c11 <hello>:
    7c11:   48                      rex.W
    7c12:   65 6c                   gs insb (%dx),%es:(%rdi)
    7c14:   6c                      insb   (%dx),%es:(%rdi)
    7c15:   6f                      outsl  %ds:(%rsi),(%dx)
    7c16:   20 77 6f                and    %dh,0x6f(%rdi)
    7c19:   72 6c                   jb     7c87 <filloop+0x69>
    7c1b:   64 21 00                and    %eax,%fs:(%rax)

0000000000007c1e <filloop>:
    ...

0000000000007dfe <end>:
    7dfe:   55                      push   %rbp
    7dff:   aa                      stos   %al,%es:(%rdi)

如果我 hexdump 它(你也可以在上面的反汇编中看到字节)我的前 6 个字节是

8b 36
11 7c b4 0e

与教程中的 be 10 7c b4 0e 相比(十六进制转储的其余部分完全相同,直至字节)。现在我明白 ac 是 lodsb (loadstringbyte) 的指令,所以 b4 0e 必须将 0e 加载到 %ah 并且 be 10 7c 必须指向 %si 到地址 7c10 的 hello 标签(注意小端)。我用十六进制编辑器更改了相应的字节,它突然起作用了。虽然反汇编有点像这样混淆:

0000000000007c00 <_main>:
    7c00:   be 10 7c b4 0e          mov    [=15=]xeb47c10,%esi
    7c05:   ac                      lods   %ds:(%rsi),%al

我原来的版本只是打印了一个大写'S'。有人可以帮助我了解为什么这些第一条指令字节的设置不同吗?

我在 Debian 9 64 位上编写所有这些代码,运行 它作为软盘在 qemu-system-x86_64 上。

如果您想将指令解码为 16 位,则需要使用 -Mi8086 选项告诉 OBJDUMP。由于您使用 ASLD 创建了一个 64 位对象,因此默认情况下它被解码为 64 位指令。 -M 覆盖它。 i8086是16位指令译码。

代码中的许多问题都与未正确设置段寄存器有关,包括 DS。我在 中讨论了其中的许多问题。同样在 AT&T 语法中,如果您需要标签的地址(立即操作数),则需要在标签前添加 $movw hello, %si 应该是 movw $hello, %si。或者,您可以使用 LEA 获取内存操作数并仅计算地址(但不检索数据)。在那种情况下,您不使用 $ 标志。 leaw hello, %si 应该也可以。

使用INT 10h/AH=0Eh时,您应该设置BH,这是要显示的页码。 0是可见页。

考虑到所有这些,这段代码应该可以工作:

start:
.code16         #real mode
.text
.globl _main
_main:
    xor  %ax, %ax      # We  are usin offset 0x7c00, thus we need to se segment to 0x0000
    mov  %ax, %ds
    mov  %ax, %es
    mov  %ax, %ss      # Set the stack to grow down just below bootloader
    mov  [=10=]x7c00, %sp
    cld                # Ensure forward movement of lods/movs/scas instructions

    movw $hello, %si   # We want the address of hello, not what it points at
    #leaw hello, %si   # Alternative way to get address with LEA instruction.
    movb [=10=]x0e, %ah
    xor  %bh, %bh      # Make sure video page number is set (we want 0)

loophere:
    lodsb
    or %al, %al     #is al==0 ?
    jz halt         #if previous instruction sets zero flag jump to halt
    int [=10=]x10       #run bios interrupt 0x10 (ah is set to 0x0e so a character is displayed)
    jmp loophere


halt:
    cli
    hlt


hello:  .ascii "Hello world![=10=]"


filloop:
    .fill (510-(.-_main)),1,0   #I hope this works. Fill bootloader with 0's until byte 510


end:
    .word 0xaa55