如何获取objcopy生成的二进制图像文件中的入口点地址?

How to get an entry point address in binary image file generated by objcopy?

我正在构建 Risk-V 的模拟器 CPU 用于自己的教育目的。我有小型 POC 工作,想构建示例程序并在模拟器上测试它们。

我正在尝试用 Rust 构建示例程序,看起来我取得了一些不错的进展,但是当我必须将已编译的程序加载到我的模拟器的内存并将执行转移到 CPU 时,我卡住了那个程序。

测试程序:

#![no_std]
#![no_main]

use core::panic::PanicInfo;

#[no_mangle]
pub extern "C" fn _start() -> ! {
    loop {
        for i in 0..1000 {
            unsafe {
                let r = i as *mut u32;
                // This can panic because (500 - i) can be 0
                *r = 20000 % (500 - i);
            }
        }
    }
}

#[panic_handler]
fn panic(_info: &PanicInfo) -> ! {
    loop {}
}

构建:

$ cargo build --target riscv32i-unknown-none-elf --release

正在从 elf 目标生成二值图像:

riscv32-unknown-linux-gnu-objcopy -g -O binary \
  target/riscv32i-unknown-none-elf/release/sample1 \
  target/riscv32i-unknown-none-elf/release/sample1.bin

到目前为止一切正常,生成了大小为 5156 字节的二进制文件。

我检查了 .bin 文件,它对我来说看起来是“合法的二进制文件”。 我在文件的开头找到了一些可读的字符串(比如 attempt to calculate the remainder with a divisor of zero)——看起来它们与处理恐慌的代码有关,如果我正在做 % 0 可能会发生恐慌。 在文件末尾,我发现了一些看起来像 riskv32i 指令的东西(很容易注意到它们,因为最低有效位是 11)。 文件的其余部分用零填充。

卡住的地方我想不通:

  1. 我应该以哪个偏移量将这个 bin 映像文件加载到我的虚拟 CPU 的内存中?我不认为在 0x0 地址加载它是可以的,因为图像的开头有有用的信息,我认为程序从地址 0x0 读取它并不酷。
  2. 程序加载后,我需要将CPU执行转移到我程序的入口点(_start)。我如何找出哪个地址是入口点,以便在开始 CPU 周期之前将此地址放入 pc 寄存器?它显然不在图像的开头(那里有人类可读的字符串)。
  3. 有没有办法使这个入口点地址稳定,这样我写的所有程序都有相同的入口点地址,这样我就不必为我编译的每个程序做调整?

我用objcopy的时候可能走错了路。如果是这样,请告诉我将 ELF 文件加载到自制 CPU 模拟器的合适方法是什么。

更新:链接器参数,(由 RUSTFLAGS="-Z print-link-args" cargo build --target riscv32i-unknown-none-elf --release --verbose 提供):

rust-lld \
    -flavor \
    gnu \
    -L \
    /home/kris/.rustup/toolchains/nightly-x86_64-unknown-linux-gnu/lib/rustlib/riscv32i-unknown-none-elf/lib \
    /mnt/c/src/ws/cpu/sample1/target/riscv32i-unknown-none-elf/release/deps/sample1-4813691a581d1819.sample1.251h7tq6-cgu.0.rcgu.o \
    /mnt/c/src/ws/cpu/sample1/target/riscv32i-unknown-none-elf/release/deps/sample1-4813691a581d1819.sample1.251h7tq6-cgu.1.rcgu.o -o \
    /mnt/c/src/ws/cpu/sample1/target/riscv32i-unknown-none-elf/release/deps/sample1-4813691a581d1819 \
    --gc-sections \
    -L \
    /mnt/c/src/ws/cpu/sample1/target/riscv32i-unknown-none-elf/release/deps \
    -L \
    /mnt/c/src/ws/cpu/sample1/target/release/deps \
    -L \
    /home/kris/.rustup/toolchains/nightly-x86_64-unknown-linux-gnu/lib/rustlib/riscv32i-unknown-none-elf/lib \
    -Bstatic \
    /home/kris/.rustup/toolchains/nightly-x86_64-unknown-linux-gnu/lib/rustlib/riscv32i-unknown-none-elf/lib/librustc_std_workspace_core-6d1cf467df9db3bb.rlib \
    /home/kris/.rustup/toolchains/nightly-x86_64-unknown-linux-gnu/lib/rustlib/riscv32i-unknown-none-elf/lib/libcore-a1a0b4993598bfe4.rlib \
    /home/kris/.rustup/toolchains/nightly-x86_64-unknown-linux-gnu/lib/rustlib/riscv32i-unknown-none-elf/lib/libcompiler_builtins-a229bbbccd019775.rlib \
    -Bdynamic

我知道程序中缺少一些重要的东西,比如初始化堆栈指针寄存器。我打算在弄清楚加载逻辑

后处理这个问题

免责声明:我对 Rust 不熟悉,但你的问题与 ELF 文件格式和可以理解它的工具有关 - 我的两分钱。

  1. 您应该加载二进制文件的偏移量应该由 rust-ldd 正在使用的链接器设置决定。

例如,这个documentation描述了一个文件memory.x定义链接器使用的内存映射:

MEMORY
{
  RAM : ORIGIN = 0x80000000, LENGTH = 16K
  FLASH : ORIGIN = 0x20000000, LENGTH = 16M
}

REGION_ALIAS("REGION_TEXT", FLASH);
REGION_ALIAS("REGION_RODATA", FLASH);
REGION_ALIAS("REGION_DATA", RAM);
REGION_ALIAS("REGION_BSS", RAM);
REGION_ALIAS("REGION_HEAP", RAM);
REGION_ALIAS("REGION_STACK", RAM);

在此示例中,生成的二进制文件可能应该加载到偏移量 0x20000000

应该有与您正在使用的工具链等效的工具。

  1. 您可以使用理解 ELF 文件格式的工具找到 _start

例如,aarch64-none-elf-nm 在我为 Aarch64 编译的可执行文件之一上将显示:

aarch64-none-elf-nm h5-example.elf
0000000042000078 t $d
0000000042000000 t $x
0000000042000080 t $x
00000000420001dc t $x
00000000420001f4 t $x
0000000042000230 B __bss_end__
0000000042000230 B __bss_start__
0000000042000080 T c_entry
000000004200022c D __copy_table_end__
0000000042000220 D __copy_table_start__
0000000042000230 D __data_end__
0000000042000230 D __data_start__
0000000042000230 ? __end__
0000000042000230 B __etext
0000000042000218 T __exidx_end
0000000042000218 T __exidx_start
0000000042000230 d __fini_array_end
0000000042000230 d __fini_array_start
0000000046000230 ? __HeapLimit
0000000004000000 A __HEAP_SIZE
0000000042000230 d __init_array_end
0000000042000230 d __init_array_start
00000000420001f4 T main
0000000042000000 A __RAM_BASE
000000000e000000 A __RAM_SIZE
0000000042000000 T Reset_Handler
0000000000000000 A __ROM_BASE
0000000000000000 A __ROM_SIZE
000000004c000000 ? __StackLimit
0000000004000000 A __STACK_SIZE
0000000050000000 ? __StackTop
00000000420001dc t system_read_CurrentEL
0000000042000230 B __zero_table_end__
0000000042000230 B __zero_table_start__

在我的例子中,要执行的第一条指令将在 Reset_Handler。 我可以使用以下命令检索引用它的行:

aarch64-none-elf-nm h5-example-02.elf | grep ' Reset_Handler$'
0000000042000000 T Reset_Handler

及其十六进制的确切地址使用:

aarch64-none-elf-nm h5-example-02.elf | grep ' Reset_Handler$' | cut -d ' ' -f1
0000000042000000

RESET_HANDLER=$(aarch64-none-elf-nm h5-example-02.elf | grep ' Reset_Handler$' | cut -d ' ' -f1)
echo ${RESET_HANDLER}

当然会显示:

0000000042000000

现在起始地址已知,在您的 DIY 模拟器中使用它会有多种选择。我想到的两个是:

a) 将地址作为参数传递给您的模拟器,即:

my-emulator 0000000042000000my-emulator -s 0000000042000000

b) 由于您掌握了模拟器将加载的图像格式,因此您可以召集系统地将起始地址添加到 objcopy 生成的二进制文件中:这样,您将读取前 4 或 8 个字节首先是二进制文件,获取起始地址,然后读取剩余的字节。

一个简单的方法就是使用 xxdcat:

echo 0000000042000000 | xxd -r -p > final-image.bin
cat sample1.bin >> final-image.bin

使用包含 'ABCD' 的示例文件,我们将得到:

printf "ABCD" > sample1.bin
hexdump -C sample1.bin
00000000  41 42 43 44                                       |ABCD|
00000004

echo 0000000042000000 | xxd -r -p > final-image.bin
hexdump -C final-image.bin

00000000  00 00 00 00 42 00 00 00                           |....B...|
00000008

cat sample1.bin >> final-image.bin
hexdump -C final-image.bin
00000000  00 00 00 00 42 00 00 00  41 42 43 44              |....B...ABCD|
0000000c

您当然可以定义更复杂的 header,可能包含一些其他重要的符号,或者为您的模拟器添加更多 command-line 选项 - 基本原理将保持不变。

  1. 是的,您可以强制编译器将 _start() 函数放入特定的链接器部分,如 here 所述,使用 link_section directive/pragma:

程序:

#[no_mangle]
pub unsafe extern "C" fn Reset() -> ! {
    let _x = 42;

    // can't return so we go into an infinite loop here
    loop {}
}

// The reset vector, a pointer into the reset handler
#[link_section = ".vector_table.reset_vector"]
#[no_mangle]
pub static RESET_VECTOR: unsafe extern "C" fn() -> ! = Reset;

链接描述文件:

/* Memory layout of the LM3S6965 microcontroller */
/* 1K = 1 KiBi = 1024 bytes */
MEMORY
{
  FLASH : ORIGIN = 0x00000000, LENGTH = 256K
  RAM : ORIGIN = 0x20000000, LENGTH = 64K
}

/* The entry point is the reset handler */
ENTRY(Reset);

EXTERN(RESET_VECTOR);

SECTIONS
{
  .vector_table ORIGIN(FLASH) :
  {
    /* First entry: initial Stack Pointer value */
    LONG(ORIGIN(RAM) + LENGTH(RAM));

    /* Second entry: reset vector */
    KEEP(*(.vector_table.reset_vector));
  } > FLASH

  .text :
  {
    *(.text .text.*);
  } > FLASH

  /DISCARD/ :
  {
    *(.ARM.exidx .ARM.exidx.*);
  }
}

这样,_start() 函数的代码将始终放在 .vector_table 部分的开头,该部分定义为 FLASH 区域中的第一个。

因此 _start() 的地址将始终是 0x00000000,或者您决定重置地址将在您的 CPU 中的任何地址:您只需要修改地址FLASH 区域从哪里开始。

该示例与 Arm Cortex-M MCU 相关,您可以将 .vector_table 部分替换为您自己的 .startup 部分。

我希望我不是off-track那个...