从汇编逆向工程优化的 C 代码

Reverse engineer optimized c code from assembly

这个问题的重点是对在 运行 具有 2 级优化的编译器之后生成的 c 代码进行逆向工程。原c代码如下(计算最大公约数):

int gcd(int a, int b){
    int returnValue = 0;
    if (a != 0 &&  b != 0){
        int r;
        int flag = 0;
        while (flag == 0){
            r = a % b;
            if (r ==0){
                flag = 1;
            } else {
                a = b;
                b = r;
            }
        }
        returnValue = b;
    }
    return(returnValue);
}

当我 运行 优化编译时,我 运行 从命令行执行此操作:

gcc -O2 -S Problem04b.c

获取此优化代码的汇编文件

.gcd:
    .LFB12:
        .cfi_startproc
        testl   %esi, %esi
        je  .L2
        testl   %edi, %edi
        je  .L2
    .L7:
        movl    %edi, %edx
        movl    %edi, %eax
        movl    %esi, %edi
        sarl    , %edx
        idivl   %esi
        testl   %edx, %edx
        jne .L9
        movl    %esi, %eax
        ret
        .p2align 4,,10
        .p2align 3
    .L2:
        xorl    %esi, %esi
        movl    %esi, %eax
        ret
        .p2align 4,,10
        .p2align 3
    .L9:
        movl    %edx, %esi
        jmp .L7
        .cfi_endproc

我需要将此汇编代码转换回 C 代码,这是我现在所在的位置:

int gcd(int a int b){
    /*
       testl %esi %esi
       sets zero flag if a is 0 (ZF) but doesn't store anything
       */
    if (a == 0){
        /*
           xorl %esi %esi
           sets the value of a variable to 0. More compact than movl
           */
        int returnValue = 0;
        /*
           movl %esi %eax
           ret

           return the value just assigned
           */
        return(returnValue);
    }
    /*
       testl %edi %edi
       sets zero flag if b is 0 (ZF) but doesn't store anything
       */
    if (b == 0){
        /*
           xorl %esi %esi
           sets the value of a variable to 0. More compact than movl
           */
        int returnValue = 0;
        /*
           movl %esi %eax
           ret

           return the value just assigned
           */
        return(returnValue);
    }

    do{
        int r = b;
        int returnValue = b;

    }while();


}

谁能帮我把它写回 C 代码?我几乎迷路了。

首先,您的代码中混合了这些值。 %esi 以值 b 开头,%edi 以值 a 开头。

你可以从testl %edx, %edx行推断出%edx被用作以.L7开头的循环的条件变量(如果%edx与0不同则控制权转移到 .L9 块,然后 returned 到 .L7)。我们将在我们的逆向工程代码中将 %edx 称为 remainder


让我们开始对主循环进行逆向工程:

movl    %edi, %edx

由于%edi存储a,这相当于用a初始化remainder的值:int remainder = a;.

movl    %edi, %eax

商店int temp = a;

movl    %esi, %edi

执行int a = b;(记住%edia%esib)。

sarl , %edx

这个算术移位指令将我们的 remainder 变量向右移动 31 位,同时保持数字的 符号 。通过移动 31 位,如果 remainder 为正(或零)则设置为 0,如果为负则设置为 -1。所以它相当于 remainder = (remainder < 0) ? -1 : 0.

idivl %esi

%edx:%eax 除以 %esi,或者在我们的例子中,将 remainder * temp 除以 b(变量)。 剩余的 将存储在%edx 中,或者在我们的代码中,remainder。将其与前面的指令组合时:if remainder < 0 then remainder = -1 * temp % b,否则 remainder = temp % b.

testl   %edx, %edx
jne .L9

检查 remainder 是否等于 0 - 如果不等于,跳转到 .L9。那里的代码只是将 return 之前的 b = remainder; 设置为 .L7。为了在 C 中实现这一点,我们将保留一个 count 变量来存储循环迭代的次数。我们将在循环开始时执行 b = remainder 但仅在第一次迭代之后,即 count != 0.

我们现在准备构建完整的 C 循环:

int count = 0;
do {
    if (count != 0)
        b = remainder;
    remainder = a;
    temp = a;
    a = b;
    if (remainder < 0){
        remainder = -1 * temp % b;
    } else {
        remainder = temp % b;
    }

    count++;
} while (remainder != 0)

循环结束后,

movl    %esi, %eax
ret

将 return 程序计算的 GCD(在我们的代码中它将存储在 b 变量中)。