从汇编逆向工程优化的 C 代码
Reverse engineer optimized c code from assembly
这个问题的重点是对在 运行 具有 2 级优化的编译器之后生成的 c 代码进行逆向工程。原c代码如下(计算最大公约数):
int gcd(int a, int b){
int returnValue = 0;
if (a != 0 && b != 0){
int r;
int flag = 0;
while (flag == 0){
r = a % b;
if (r ==0){
flag = 1;
} else {
a = b;
b = r;
}
}
returnValue = b;
}
return(returnValue);
}
当我 运行 优化编译时,我 运行 从命令行执行此操作:
gcc -O2 -S Problem04b.c
获取此优化代码的汇编文件
.gcd:
.LFB12:
.cfi_startproc
testl %esi, %esi
je .L2
testl %edi, %edi
je .L2
.L7:
movl %edi, %edx
movl %edi, %eax
movl %esi, %edi
sarl , %edx
idivl %esi
testl %edx, %edx
jne .L9
movl %esi, %eax
ret
.p2align 4,,10
.p2align 3
.L2:
xorl %esi, %esi
movl %esi, %eax
ret
.p2align 4,,10
.p2align 3
.L9:
movl %edx, %esi
jmp .L7
.cfi_endproc
我需要将此汇编代码转换回 C 代码,这是我现在所在的位置:
int gcd(int a int b){
/*
testl %esi %esi
sets zero flag if a is 0 (ZF) but doesn't store anything
*/
if (a == 0){
/*
xorl %esi %esi
sets the value of a variable to 0. More compact than movl
*/
int returnValue = 0;
/*
movl %esi %eax
ret
return the value just assigned
*/
return(returnValue);
}
/*
testl %edi %edi
sets zero flag if b is 0 (ZF) but doesn't store anything
*/
if (b == 0){
/*
xorl %esi %esi
sets the value of a variable to 0. More compact than movl
*/
int returnValue = 0;
/*
movl %esi %eax
ret
return the value just assigned
*/
return(returnValue);
}
do{
int r = b;
int returnValue = b;
}while();
}
谁能帮我把它写回 C 代码?我几乎迷路了。
首先,您的代码中混合了这些值。 %esi
以值 b
开头,%edi
以值 a
开头。
你可以从testl %edx, %edx
行推断出%edx
被用作以.L7
开头的循环的条件变量(如果%edx
与0不同则控制权转移到 .L9
块,然后 returned 到 .L7
)。我们将在我们的逆向工程代码中将 %edx
称为 remainder
。
让我们开始对主循环进行逆向工程:
movl %edi, %edx
由于%edi
存储a
,这相当于用a
初始化remainder
的值:int remainder = a;
.
movl %edi, %eax
商店int temp = a;
movl %esi, %edi
执行int a = b;
(记住%edi
是a
,%esi
是b
)。
sarl , %edx
这个算术移位指令将我们的 remainder
变量向右移动 31 位,同时保持数字的 符号 。通过移动 31 位,如果 remainder
为正(或零)则设置为 0,如果为负则设置为 -1。所以它相当于 remainder = (remainder < 0) ? -1 : 0
.
idivl %esi
将 %edx:%eax
除以 %esi
,或者在我们的例子中,将 remainder * temp
除以 b
(变量)。 剩余的 将存储在%edx
中,或者在我们的代码中,remainder
。将其与前面的指令组合时:if remainder < 0
then remainder = -1 * temp % b
,否则 remainder = temp % b
.
testl %edx, %edx
jne .L9
检查 remainder
是否等于 0 - 如果不等于,跳转到 .L9
。那里的代码只是将 return 之前的 b = remainder;
设置为 .L7
。为了在 C 中实现这一点,我们将保留一个 count
变量来存储循环迭代的次数。我们将在循环开始时执行 b = remainder
但仅在第一次迭代之后,即 count != 0
.
我们现在准备构建完整的 C 循环:
int count = 0;
do {
if (count != 0)
b = remainder;
remainder = a;
temp = a;
a = b;
if (remainder < 0){
remainder = -1 * temp % b;
} else {
remainder = temp % b;
}
count++;
} while (remainder != 0)
循环结束后,
movl %esi, %eax
ret
将 return 程序计算的 GCD(在我们的代码中它将存储在 b
变量中)。
这个问题的重点是对在 运行 具有 2 级优化的编译器之后生成的 c 代码进行逆向工程。原c代码如下(计算最大公约数):
int gcd(int a, int b){
int returnValue = 0;
if (a != 0 && b != 0){
int r;
int flag = 0;
while (flag == 0){
r = a % b;
if (r ==0){
flag = 1;
} else {
a = b;
b = r;
}
}
returnValue = b;
}
return(returnValue);
}
当我 运行 优化编译时,我 运行 从命令行执行此操作:
gcc -O2 -S Problem04b.c
获取此优化代码的汇编文件
.gcd:
.LFB12:
.cfi_startproc
testl %esi, %esi
je .L2
testl %edi, %edi
je .L2
.L7:
movl %edi, %edx
movl %edi, %eax
movl %esi, %edi
sarl , %edx
idivl %esi
testl %edx, %edx
jne .L9
movl %esi, %eax
ret
.p2align 4,,10
.p2align 3
.L2:
xorl %esi, %esi
movl %esi, %eax
ret
.p2align 4,,10
.p2align 3
.L9:
movl %edx, %esi
jmp .L7
.cfi_endproc
我需要将此汇编代码转换回 C 代码,这是我现在所在的位置:
int gcd(int a int b){
/*
testl %esi %esi
sets zero flag if a is 0 (ZF) but doesn't store anything
*/
if (a == 0){
/*
xorl %esi %esi
sets the value of a variable to 0. More compact than movl
*/
int returnValue = 0;
/*
movl %esi %eax
ret
return the value just assigned
*/
return(returnValue);
}
/*
testl %edi %edi
sets zero flag if b is 0 (ZF) but doesn't store anything
*/
if (b == 0){
/*
xorl %esi %esi
sets the value of a variable to 0. More compact than movl
*/
int returnValue = 0;
/*
movl %esi %eax
ret
return the value just assigned
*/
return(returnValue);
}
do{
int r = b;
int returnValue = b;
}while();
}
谁能帮我把它写回 C 代码?我几乎迷路了。
首先,您的代码中混合了这些值。 %esi
以值 b
开头,%edi
以值 a
开头。
你可以从testl %edx, %edx
行推断出%edx
被用作以.L7
开头的循环的条件变量(如果%edx
与0不同则控制权转移到 .L9
块,然后 returned 到 .L7
)。我们将在我们的逆向工程代码中将 %edx
称为 remainder
。
让我们开始对主循环进行逆向工程:
movl %edi, %edx
由于%edi
存储a
,这相当于用a
初始化remainder
的值:int remainder = a;
.
movl %edi, %eax
商店int temp = a;
movl %esi, %edi
执行int a = b;
(记住%edi
是a
,%esi
是b
)。
sarl , %edx
这个算术移位指令将我们的 remainder
变量向右移动 31 位,同时保持数字的 符号 。通过移动 31 位,如果 remainder
为正(或零)则设置为 0,如果为负则设置为 -1。所以它相当于 remainder = (remainder < 0) ? -1 : 0
.
idivl %esi
将 %edx:%eax
除以 %esi
,或者在我们的例子中,将 remainder * temp
除以 b
(变量)。 剩余的 将存储在%edx
中,或者在我们的代码中,remainder
。将其与前面的指令组合时:if remainder < 0
then remainder = -1 * temp % b
,否则 remainder = temp % b
.
testl %edx, %edx
jne .L9
检查 remainder
是否等于 0 - 如果不等于,跳转到 .L9
。那里的代码只是将 return 之前的 b = remainder;
设置为 .L7
。为了在 C 中实现这一点,我们将保留一个 count
变量来存储循环迭代的次数。我们将在循环开始时执行 b = remainder
但仅在第一次迭代之后,即 count != 0
.
我们现在准备构建完整的 C 循环:
int count = 0;
do {
if (count != 0)
b = remainder;
remainder = a;
temp = a;
a = b;
if (remainder < 0){
remainder = -1 * temp % b;
} else {
remainder = temp % b;
}
count++;
} while (remainder != 0)
循环结束后,
movl %esi, %eax
ret
将 return 程序计算的 GCD(在我们的代码中它将存储在 b
变量中)。