理解 RiscV objdump

Understanding RiscV objdump

我正在检查使用以下命令编译的 C 文件的 objdump:

riscv64-unknown-elf-gcc -O0 -o maxmul.o maxmul.c
riscv64-unknown-elf-objdump -d maxmul.o > maxmul.dump

奇怪的是(或不是)地址似乎没有在 32 位字上对齐,但实际上在 16 位边界上。

谁能解释一下为什么?

谢谢。

objdump 摘录:

00000000000101da <main>:
   101da:   7155                    addi    sp,sp,-208
   101dc:   e586                    sd  ra,200(sp)
   101de:   e1a2                    sd  s0,192(sp)
   101e0:   0980                    addi    s0,sp,208
   ...

C 代码:

int main()
{

  int first[3][3], second[3][3], multiply[3][3];
  int golden[3][3];
  int sum;

  first[0][0] = 1;  first[0][1] = 2;  first[0][2] = 3;
  first[1][0] = 4;  first[1][1] = 5;  first[1][2] = 6;
  first[2][0] = 7;  first[2][1] = 8;  first[2][2] = 9;

  second[0][0] = 9;  second[0][1] = 8;  second[0][2] = -7;
  second[1][0] = -6; second[1][1] = 5;  second[1][2] = 4;
  second[2][0] = 3;  second[2][1] = 2;  second[2][2] = -1;

  golden[0][0] = 6;  golden[0][1] = 24;  golden[0][2] = -2;
  golden[1][0] = 24; golden[1][1] = 69;  golden[1][2] = -14;
  golden[2][0] = 42; golden[2][1] = 1140;  golden[2][2] = -26;

  int i, ii, iii;
  for (i = 0; i < 3; i++) {
      for (ii = 0; ii < 3; ii++) {
          for (iii = 0; iii < 3; iii++) {
              //printf("first[%d][%d] * second[%d][%d] \n",  i, iii, iii, ii);
              //printf("%d * %d (%d,%d)\n", first[i][ii], second[ii][i], i, ii);
              sum +=  first[i][iii] * second[iii][ii];
          }
          //printf("sum = %d\n", sum);
          multiply[i][ii] = sum;
          sum = 0;
      }
  }

 int c, d;
 int err;
 for ( c = 0; c < 3; c++) {
      for ( d = 0; d < 3; d++) {
    //printf("%d\t", multiply[c][d]);
          if (multiply[c][d] != golden[c][d]) {
              fail(golden[c][d], multiply[c][d]);
              err++;
          }
      }

      //printf("\n");
    }
    if (err == 0) {
          pass();
      }
   return 0;
}

我怀疑您的 gcc 默认使用压缩指令格式编译,其中指令可以是 16b 和 32b 混合 - 在这种情况下,16b 指令是 16b 对齐的,正如您在反汇编代码中看到的那样。

Objdump提供地址、编码、助记词;您的编码始终为 16b,这意味着编译器已尽可能选择 16b 指令。

通过启用详细模式 (-verbose),您可以看到,默认情况下,-march=rv64imafdc-mabi=lp64d。默认的targeted ISA是压缩的,targeted ABI需要Double floats extension.

通过设置 -march=rv64imafd 并让 ABI 不变,gcc 成功地使用只有 32b 的指令进行编译,因为不再启用​​压缩 ISA。 指令的地址总是 32b 对齐。

当编译(或汇编)到 RV64GC 或 RV32GC(或另一个启用 "C" Standard Extension Compressed Instructions), 编译器(或汇编器)自动将一些指令替换为压缩指令。

非压缩指令以 32 位编码,而压缩指令以 16 位编码。

发出压缩指令时,它会更改下一条指令的对齐方式。从 32 位到 16 位或从 16 位到 32 位。这意味着不仅 16 位宽指令可以与 16 位地址对齐,而且 32 位宽指令也可以对齐。 IOW 两种类型的指令(压缩指令和普通指令)并排紧密排列。

默认情况下,objdump -d 不会明确指示指令已压缩,因为它使用与未压缩变体相同的助记符。尽管显示的原始指令中的字节数泄露了它(4 对 2 字节)。

但是,您可以告诉 objdump 对压缩指令使用单独的助记符,以便更容易识别它们(那些以 c. 开头的指令),例如:

$ riscv64-unknown-elf-objdump -d -M no-aliases rotate
   [..]
   101e4:       00d66533                or      a0,a2,a3
   101e8:       8082                    c.jr    ra

00000000000101ea <rotr>:
   101ea:       00b55633                srl     a2,a0,a1
   [..]

请注意,使用开关 -M no-aliases 不再显示伪指令,而是显示相应的指令。