理解 RiscV objdump
Understanding RiscV objdump
我正在检查使用以下命令编译的 C 文件的 objdump:
riscv64-unknown-elf-gcc -O0 -o maxmul.o maxmul.c
riscv64-unknown-elf-objdump -d maxmul.o > maxmul.dump
奇怪的是(或不是)地址似乎没有在 32 位字上对齐,但实际上在 16 位边界上。
谁能解释一下为什么?
谢谢。
objdump 摘录:
00000000000101da <main>:
101da: 7155 addi sp,sp,-208
101dc: e586 sd ra,200(sp)
101de: e1a2 sd s0,192(sp)
101e0: 0980 addi s0,sp,208
...
C 代码:
int main()
{
int first[3][3], second[3][3], multiply[3][3];
int golden[3][3];
int sum;
first[0][0] = 1; first[0][1] = 2; first[0][2] = 3;
first[1][0] = 4; first[1][1] = 5; first[1][2] = 6;
first[2][0] = 7; first[2][1] = 8; first[2][2] = 9;
second[0][0] = 9; second[0][1] = 8; second[0][2] = -7;
second[1][0] = -6; second[1][1] = 5; second[1][2] = 4;
second[2][0] = 3; second[2][1] = 2; second[2][2] = -1;
golden[0][0] = 6; golden[0][1] = 24; golden[0][2] = -2;
golden[1][0] = 24; golden[1][1] = 69; golden[1][2] = -14;
golden[2][0] = 42; golden[2][1] = 1140; golden[2][2] = -26;
int i, ii, iii;
for (i = 0; i < 3; i++) {
for (ii = 0; ii < 3; ii++) {
for (iii = 0; iii < 3; iii++) {
//printf("first[%d][%d] * second[%d][%d] \n", i, iii, iii, ii);
//printf("%d * %d (%d,%d)\n", first[i][ii], second[ii][i], i, ii);
sum += first[i][iii] * second[iii][ii];
}
//printf("sum = %d\n", sum);
multiply[i][ii] = sum;
sum = 0;
}
}
int c, d;
int err;
for ( c = 0; c < 3; c++) {
for ( d = 0; d < 3; d++) {
//printf("%d\t", multiply[c][d]);
if (multiply[c][d] != golden[c][d]) {
fail(golden[c][d], multiply[c][d]);
err++;
}
}
//printf("\n");
}
if (err == 0) {
pass();
}
return 0;
}
我怀疑您的 gcc 默认使用压缩指令格式编译,其中指令可以是 16b 和 32b 混合 - 在这种情况下,16b 指令是 16b 对齐的,正如您在反汇编代码中看到的那样。
Objdump提供地址、编码、助记词;您的编码始终为 16b,这意味着编译器已尽可能选择 16b 指令。
通过启用详细模式 (-verbose
),您可以看到,默认情况下,-march=rv64imafdc
和 -mabi=lp64d
。默认的targeted ISA是压缩的,targeted ABI需要Double floats extension.
通过设置 -march=rv64imafd
并让 ABI 不变,gcc 成功地使用只有 32b 的指令进行编译,因为不再启用压缩 ISA。
指令的地址总是 32b 对齐。
当编译(或汇编)到 RV64GC 或 RV32GC(或另一个启用 "C" Standard Extension Compressed Instructions), 编译器(或汇编器)自动将一些指令替换为压缩指令。
非压缩指令以 32 位编码,而压缩指令以 16 位编码。
发出压缩指令时,它会更改下一条指令的对齐方式。从 32 位到 16 位或从 16 位到 32 位。这意味着不仅 16 位宽指令可以与 16 位地址对齐,而且 32 位宽指令也可以对齐。 IOW 两种类型的指令(压缩指令和普通指令)并排紧密排列。
默认情况下,objdump -d
不会明确指示指令已压缩,因为它使用与未压缩变体相同的助记符。尽管显示的原始指令中的字节数泄露了它(4 对 2 字节)。
但是,您可以告诉 objdump
对压缩指令使用单独的助记符,以便更容易识别它们(那些以 c.
开头的指令),例如:
$ riscv64-unknown-elf-objdump -d -M no-aliases rotate
[..]
101e4: 00d66533 or a0,a2,a3
101e8: 8082 c.jr ra
00000000000101ea <rotr>:
101ea: 00b55633 srl a2,a0,a1
[..]
请注意,使用开关 -M no-aliases
不再显示伪指令,而是显示相应的指令。
我正在检查使用以下命令编译的 C 文件的 objdump:
riscv64-unknown-elf-gcc -O0 -o maxmul.o maxmul.c
riscv64-unknown-elf-objdump -d maxmul.o > maxmul.dump
奇怪的是(或不是)地址似乎没有在 32 位字上对齐,但实际上在 16 位边界上。
谁能解释一下为什么?
谢谢。
objdump 摘录:
00000000000101da <main>:
101da: 7155 addi sp,sp,-208
101dc: e586 sd ra,200(sp)
101de: e1a2 sd s0,192(sp)
101e0: 0980 addi s0,sp,208
...
C 代码:
int main()
{
int first[3][3], second[3][3], multiply[3][3];
int golden[3][3];
int sum;
first[0][0] = 1; first[0][1] = 2; first[0][2] = 3;
first[1][0] = 4; first[1][1] = 5; first[1][2] = 6;
first[2][0] = 7; first[2][1] = 8; first[2][2] = 9;
second[0][0] = 9; second[0][1] = 8; second[0][2] = -7;
second[1][0] = -6; second[1][1] = 5; second[1][2] = 4;
second[2][0] = 3; second[2][1] = 2; second[2][2] = -1;
golden[0][0] = 6; golden[0][1] = 24; golden[0][2] = -2;
golden[1][0] = 24; golden[1][1] = 69; golden[1][2] = -14;
golden[2][0] = 42; golden[2][1] = 1140; golden[2][2] = -26;
int i, ii, iii;
for (i = 0; i < 3; i++) {
for (ii = 0; ii < 3; ii++) {
for (iii = 0; iii < 3; iii++) {
//printf("first[%d][%d] * second[%d][%d] \n", i, iii, iii, ii);
//printf("%d * %d (%d,%d)\n", first[i][ii], second[ii][i], i, ii);
sum += first[i][iii] * second[iii][ii];
}
//printf("sum = %d\n", sum);
multiply[i][ii] = sum;
sum = 0;
}
}
int c, d;
int err;
for ( c = 0; c < 3; c++) {
for ( d = 0; d < 3; d++) {
//printf("%d\t", multiply[c][d]);
if (multiply[c][d] != golden[c][d]) {
fail(golden[c][d], multiply[c][d]);
err++;
}
}
//printf("\n");
}
if (err == 0) {
pass();
}
return 0;
}
我怀疑您的 gcc 默认使用压缩指令格式编译,其中指令可以是 16b 和 32b 混合 - 在这种情况下,16b 指令是 16b 对齐的,正如您在反汇编代码中看到的那样。
Objdump提供地址、编码、助记词;您的编码始终为 16b,这意味着编译器已尽可能选择 16b 指令。
通过启用详细模式 (-verbose
),您可以看到,默认情况下,-march=rv64imafdc
和 -mabi=lp64d
。默认的targeted ISA是压缩的,targeted ABI需要Double floats extension.
通过设置 -march=rv64imafd
并让 ABI 不变,gcc 成功地使用只有 32b 的指令进行编译,因为不再启用压缩 ISA。
指令的地址总是 32b 对齐。
当编译(或汇编)到 RV64GC 或 RV32GC(或另一个启用 "C" Standard Extension Compressed Instructions), 编译器(或汇编器)自动将一些指令替换为压缩指令。
非压缩指令以 32 位编码,而压缩指令以 16 位编码。
发出压缩指令时,它会更改下一条指令的对齐方式。从 32 位到 16 位或从 16 位到 32 位。这意味着不仅 16 位宽指令可以与 16 位地址对齐,而且 32 位宽指令也可以对齐。 IOW 两种类型的指令(压缩指令和普通指令)并排紧密排列。
默认情况下,objdump -d
不会明确指示指令已压缩,因为它使用与未压缩变体相同的助记符。尽管显示的原始指令中的字节数泄露了它(4 对 2 字节)。
但是,您可以告诉 objdump
对压缩指令使用单独的助记符,以便更容易识别它们(那些以 c.
开头的指令),例如:
$ riscv64-unknown-elf-objdump -d -M no-aliases rotate
[..]
101e4: 00d66533 or a0,a2,a3
101e8: 8082 c.jr ra
00000000000101ea <rotr>:
101ea: 00b55633 srl a2,a0,a1
[..]
请注意,使用开关 -M no-aliases
不再显示伪指令,而是显示相应的指令。