在 x86 中,为什么我有两次相同的指令,但操作数相反?
In x86, why do I have the same instruction two times, with reversed operands?
我正在用 x86
asm 做几个实验,试图了解通用语言构造如何映射到汇编中。在我目前的实验中,我试图具体了解 C 语言指针如何映射到寄存器间接寻址。我写了一个相当像指针程序的 hello-world:
#include <stdio.h>
int
main (void)
{
int value = 5;
int *int_val = &value;
printf ("The value we have is %d\n", *int_val);
return 0;
}
并将其编译为以下 asm 使用:gcc -o pointer.s -fno-asynchronous-unwind-tables pointer.c
:[1][2]
.file "pointer.c"
.section .rodata
.LC0:
.string "The value we have is %d\n"
.text
.globl main
.type main, @function
main:
;------- function prologue
pushq %rbp
movq %rsp, %rbp
;---------------------------------
subq , %rsp
movq %fs:40, %rax
movq %rax, -8(%rbp)
xorl %eax, %eax
;----------------------------------
movl , -20(%rbp) ; This is where the value 5 is stored in `value` (automatic allocation)
;----------------------------------
leaq -20(%rbp), %rax ;; (GUESS) If I have understood correctly, this is where the address of `value` is
;; extracted, and stored into %rax
;----------------------------------
movq %rax, -16(%rbp) ;;
movq -16(%rbp), %rax ;; Why do I have two times the same instructions, with reversed operands???
;----------------------------------
movl (%rax), %eax
movl %eax, %esi
movl $.LC0, %edi
movl [=11=], %eax
call printf
;----------------------------------
movl [=11=], %eax
movq -8(%rbp), %rdx
xorq %fs:40, %rdx
je .L3
call __stack_chk_fail
.L3:
leave
ret
.size main, .-main
.ident "GCC: (Ubuntu 4.9.1-16ubuntu6) 4.9.1"
.section .note.GNU-stack,"",@progbits
我的问题是我不明白为什么它包含两次指令 movq
,并且操作数相反。 谁能给我解释一下?
[1]: 我想避免在根本不需要时让我的 asm 代码与 cfi 指令交织在一起。
[2]:我的环境是Ubuntu 14.10
、gcc 4.9.1
(由ubuntu修改)和Gnu assembler (GNU Binutils for Ubuntu) 2.24.90.20141014
,配置为目标x86_64-linux-gnu
如果你重新组织你的块,也许会更清楚:
;----------------------------------
leaq -20(%rbp), %rax ; &value
movq %rax, -16(%rbp) ; int_val
;----------------------------------
movq -16(%rbp), %rax ; int_val
movl (%rax), %eax ; *int_val
movl %eax, %esi ; printf-argument
movl $.LC0, %edi ; printf-argument (format-string)
movl [=10=], %eax ; no floating-point numbers
call printf
;----------------------------------
第一块执行int *int_val = &value;
,第二块执行printf ...
。没有优化,块是独立的。
由于您没有进行任何优化,gcc 创建了非常简单的代码,一次只执行程序中的每个语句,而无需查看任何其他语句。因此,在您的示例中,它将一个值存储到变量 int_val
中,然后下一条指令再次读取该变量作为下一条语句的一部分。在这两种情况下,它都使用 %rax
作为临时保存值,因为这是通常用于事物的第一个寄存器。
我正在用 x86
asm 做几个实验,试图了解通用语言构造如何映射到汇编中。在我目前的实验中,我试图具体了解 C 语言指针如何映射到寄存器间接寻址。我写了一个相当像指针程序的 hello-world:
#include <stdio.h>
int
main (void)
{
int value = 5;
int *int_val = &value;
printf ("The value we have is %d\n", *int_val);
return 0;
}
并将其编译为以下 asm 使用:gcc -o pointer.s -fno-asynchronous-unwind-tables pointer.c
:[1][2]
.file "pointer.c"
.section .rodata
.LC0:
.string "The value we have is %d\n"
.text
.globl main
.type main, @function
main:
;------- function prologue
pushq %rbp
movq %rsp, %rbp
;---------------------------------
subq , %rsp
movq %fs:40, %rax
movq %rax, -8(%rbp)
xorl %eax, %eax
;----------------------------------
movl , -20(%rbp) ; This is where the value 5 is stored in `value` (automatic allocation)
;----------------------------------
leaq -20(%rbp), %rax ;; (GUESS) If I have understood correctly, this is where the address of `value` is
;; extracted, and stored into %rax
;----------------------------------
movq %rax, -16(%rbp) ;;
movq -16(%rbp), %rax ;; Why do I have two times the same instructions, with reversed operands???
;----------------------------------
movl (%rax), %eax
movl %eax, %esi
movl $.LC0, %edi
movl [=11=], %eax
call printf
;----------------------------------
movl [=11=], %eax
movq -8(%rbp), %rdx
xorq %fs:40, %rdx
je .L3
call __stack_chk_fail
.L3:
leave
ret
.size main, .-main
.ident "GCC: (Ubuntu 4.9.1-16ubuntu6) 4.9.1"
.section .note.GNU-stack,"",@progbits
我的问题是我不明白为什么它包含两次指令 movq
,并且操作数相反。 谁能给我解释一下?
[1]: 我想避免在根本不需要时让我的 asm 代码与 cfi 指令交织在一起。
[2]:我的环境是Ubuntu 14.10
、gcc 4.9.1
(由ubuntu修改)和Gnu assembler (GNU Binutils for Ubuntu) 2.24.90.20141014
,配置为目标x86_64-linux-gnu
如果你重新组织你的块,也许会更清楚:
;----------------------------------
leaq -20(%rbp), %rax ; &value
movq %rax, -16(%rbp) ; int_val
;----------------------------------
movq -16(%rbp), %rax ; int_val
movl (%rax), %eax ; *int_val
movl %eax, %esi ; printf-argument
movl $.LC0, %edi ; printf-argument (format-string)
movl [=10=], %eax ; no floating-point numbers
call printf
;----------------------------------
第一块执行int *int_val = &value;
,第二块执行printf ...
。没有优化,块是独立的。
由于您没有进行任何优化,gcc 创建了非常简单的代码,一次只执行程序中的每个语句,而无需查看任何其他语句。因此,在您的示例中,它将一个值存储到变量 int_val
中,然后下一条指令再次读取该变量作为下一条语句的一部分。在这两种情况下,它都使用 %rax
作为临时保存值,因为这是通常用于事物的第一个寄存器。