裸机 ARM Raspberry Pi + qemu 具有浮点除法的奇怪行为

Bare-metal ARM Raspberry Pi + qemu strange behavior with floating point division

我目前正在自学裸机ARM内核开发,在有据可查的基础上,我决定使用Raspberry Pi 2作为目标平台。我目前正在使用 qemu 模拟设备。 在我的内核调用的函数中,我需要将一个数值常量除以一个函数参数,并将结果存储为浮点数以供将来计算。 调用此函数会导致 qemu 关闭 rails。这是函数本身(设置 PL011 波特率):

void pl011_set_baud_rate(pl011_uart_t *uart, uint32_t baud_rate) {
    float divider = PL011_UART_CLOCK / (16.0f * baud_rate);
    uint16_t integer_divider = (uint16_t)divider;
    uint8_t fractional_divider = ((divider - integer_divider) * 64) + 0.5;
    mmio_write(uart->IBRD, integer_divider);        // Integer baud rate divider
    mmio_write(uart->FBRD, fractional_divider);     // Fractional baud rate divider
};

我会 post 一个最小的可验证示例,但几乎任何事情都会触发该问题。如果你甚至使用:

void test(uint32_t test_var) {
    float test_div = test_var / 16;
    (void)test_div;    // squash [-Wunused-variable] warnings
    // goes off the rails here
};

你会得到相同的结果。

单步执行 gdb 中的函数,单步执行 float divider... 将导致 qemu 跳出该函数并直接进入我的引导加载程序代码中的暂停循环(因为当内核 main returns )

在 gdb 中检查 info args 显示正确的参数。检查 info locals 将显示 float divider 的正确值。检查 info stack 显示正确的堆栈跟踪和参数。 最初我怀疑 sp 可能在错误的地方,但由于堆栈跟踪看起来正常,所以没有检查出来。 (对于裸机)

(gdb) info stack
#0  pl011_set_baud_rate (uart=0x3f201000, baud_rate=115200) at kernel/uart/pl011.c:23
#1  0x0000837c in pl011_init (uart=0x3f201000) at kernel/uart/pl011.c:49
#2  0x0000806c in uart_init () at kernel/uart/uart.c:12
#3  0x00008030 in kernel_init (r0=0, r1=0, atags=0) at kernel/boot/start.c:10
#4  0x00008008 in _start () at kernel/boot/boot.S:6
Backtrace stopped: previous frame identical to this frame (corrupt stack?)
(gdb) 

这是导致不可预测行为的行之前的寄存器转储:

r0             0x3f201000       1059065856
r1             0x1c200  115200
r2             0x7ff    2047
r3             0x0      0
r4             0x0      0
r5             0x0      0
r6             0x0      0
r7             0x0      0
r8             0x0      0
r9             0x0      0
r10            0x0      0
r11            0x7fcc   32716
r12            0x0      0
sp             0x7fb0   0x7fb0
lr             0x837c   33660
pc             0x8248   0x8248 <pl011_set_baud_rate+20>
cpsr           0x600001d3       1610613203

我的 Makefile 是:

INCLUDES=include
INCLUDE_PARAMS=$(foreach d, $(INCLUDES), -I$d)

CC=arm-none-eabi-gcc

C_SOURCES:=kernel/boot/start.c kernel/uart/uart.c kernel/uart/pl011.c
AS_SOURCES:=kernel/boot/boot.S

SOURCES=$(C_SOURCES)
SOURCES+=$(AS_SOURCES)

OBJECTS=
OBJECTS+=$(C_SOURCES:.c=.o)
OBJECTS+=$(AS_SOURCES:.S=.o)


CFLAGS=-std=gnu99 -Wall -Wextra -fpic -ffreestanding -mcpu=cortex-a7 -mfpu=neon-vfpv4 -mfloat-abi=hard
LDFLAGS=-ffreestanding -nostdlib

LIBS=-lgcc

DEBUG_FLAGS=

BINARY=kernel.bin

.PHONY: all clean debug

all: $(BINARY)

debug: DEBUG_FLAGS += -ggdb
debug: $(BINARY)

$(BINARY): $(OBJECTS)
    $(CC) -T linker.ld $(LDFLAGS) $(LIBS) $(OBJECTS) -o $(BINARY)

%.o: %.c
    $(CC) $(INCLUDE_PARAMS) $(CFLAGS) $(DEBUG_FLAGS) -c $< -o $@

%.o: %.S
    $(CC) $(INCLUDE_PARAMS) $(CFLAGS) $(DEBUG_FLAGS) -c $< -o $@

clean:
    rm $(BINARY) $(OBJECTS)

如你所见,我正在链接 lgcc,并使用 -mfpu=neon-vfpv4 -mfloat-abi=hard,所以至少 gcc 应该提供它自己的来自 lgcc 的浮点除法函数。

任何人都可以指出我调试此问题的正确方向吗? 我怀疑我使用了不正确的编译器参数并且没有加载正确的浮点除法函数,或者堆栈存在一些问题。

任何人都可以在这里发表任何见解吗?

通过关闭 rails,您的意思是您的异常处理程序被调用了吗? 如果是这样,qemu 有调试选项可以帮助找到引发的异常。检查 qemu-system-arm -M raspi2 -d help.

我们可以先启用 int,cpu_reset,unimp,guest_errors

您是否检查过 fpu 协处理器是否已启用?

原来pi1/pi-zero我用这个

;@ enable fpu
mrc p15, 0, r0, c1, c0, 2
orr r0,r0,#0x300000 ;@ single precision
orr r0,r0,#0xC00000 ;@ double precision
mcr p15, 0, r0, c1, c0, 2
mov r0,#0x40000000
fmxr fpexc,r0

最后几行如果不起作用,可能是故意崩溃的。

不幸的是,您的 pi2 中可能有一个 armv7 或 armv8 内核,因为有两种变体。我怀疑具体的寄存器和指令可能与上述基于 armv6 的 raspberry pi.

不同