iretq 抛出 GP 故障
iretq throwing GP fault
我正在尝试编写 64 位 OS。它从定时器中断处理程序在 iretq 上抛出一个 GP,然后从 GP 处理程序的 iretq 重复抛出更多的 GP。
我知道这是因为我的通用处理程序在串行端口上打印了 ISR 编号,它变成了 32、13、13、13,...
GP的错误码是10,这是我的数据段。
我在qemu里调试,所以能看到不少。这是来自计时器处理程序的 iretq 的情况:
(gdb) disas isr_common,isr_head_2
Dump of assembler code from 0x8189 to 0x81c4:
0x0000000000008189 <isr_common+0>: callq 0x8125 <sayN100>
0x000000000000818e <isr_common+5>: cmp [=10=]x20,%eax
0x0000000000008191 <isr_common+8>: jl 0x81a8 <isr_common.no_more_acks>
0x0000000000008193 <isr_common+10>: cmp [=10=]x30,%eax
0x0000000000008196 <isr_common+13>: jge 0x81a8 <isr_common.no_more_acks>
0x0000000000008198 <isr_common+15>: cmp [=10=]x28,%al
0x000000000000819a <isr_common+17>: jl 0x81a2 <isr_common.ack_master>
0x000000000000819c <isr_common+19>: push %rax
0x000000000000819d <isr_common+20>: mov [=10=]x20,%al
0x000000000000819f <isr_common+22>: out %al,[=10=]xa0
0x00000000000081a1 <isr_common+24>: pop %rax
0x00000000000081a2 <isr_common.ack_master+0>: push %rax
0x00000000000081a3 <isr_common.ack_master+1>: mov [=10=]x20,%al
0x00000000000081a5 <isr_common.ack_master+3>: out %al,[=10=]x20
0x00000000000081a7 <isr_common.ack_master+5>: pop %rax
0x00000000000081a8 <isr_common.no_more_acks+0>: cmp [=10=]x24,%ax
0x00000000000081ac <isr_common.no_more_acks+4>: pop %rax
0x00000000000081ad <isr_common.no_more_acks+5>: pop %rax
=> 0x00000000000081ae <isr_common.end+0>: iretq
0x00000000000081b0 <isr_head_0+0>: pushq [=10=]x55 ;DUMMY ERROR CODE
0x00000000000081b2 <isr_head_0+2>: mov [=10=]x0,%eax
0x00000000000081b7 <isr_head_0+7>: push %rax
0x00000000000081b8 <isr_head_0+8>: jmp 0x8189 <isr_common>
0x00000000000081ba <isr_head_1+0>: pushq [=10=]x55 ;DUMMY ERROR CODE
0x00000000000081bc <isr_head_1+2>: mov [=10=]x1,%eax
0x00000000000081c1 <isr_head_1+7>: push %rax
0x00000000000081c2 <isr_head_1+8>: jmp 0x8189 <isr_common>
这显示了在 IDT 中输入的几个 "isr_head",可能会将虚拟错误代码和 jmp 推送到 isr_common。
(gdb) bt
#0 0x00000000000081ae in isr_common.end ()
#1 0x0000000000008123 in LongMode.Nirv ()
#2 0x0000000000000010 in ?? ()
#3 0x0000000000000216 in ?? ()
#4 0x0000000000015000 in Pd ()
#5 0x0000000000000010 in ?? ()
#6 0x000000b8e5894855 in ?? ()
#7 0x78bf00000332e800 in ?? ()
#8 0x000003e3e8000000 in ?? ()
其中:
0x0000000000008122 <LongMode.Nirv+0>: hlt
0x0000000000008123 <LongMode.Nirv+1>: jmp 0x8122 <LongMode.Nirv>
注意事项:
(gdb) info registers
rax 0x55 85
rbx 0x80000011 2147483665
rcx 0xc0000080 3221225600
rdx 0x3f8 1016
rsi 0xb 11
rdi 0x3fc 1020
rbp 0x0 0x0
rsp 0x14fd8 0x14fd8 <Pd+36824>
r8 0x0 0
r9 0x0 0
r10 0x0 0
r11 0x0 0
r12 0x0 0
r13 0x0 0
r14 0x0 0
r15 0x0 0
rip 0x81ae 0x81ae <isr_common.end>
eflags 0x97 [ CF PF AF SF ]
cs 0x8 8
ss 0x10 16
ds 0x10 16
es 0x10 16
fs 0x10 16
gs 0x10 16
(gdb) x/32xg 0x14f00
0x14f00 <Pd+36608>: 0x0000000000841f0f 0x000000841f0f2e66
0x14f10 <Pd+36624>: 0x00841f0f2e660000 0x1f0f2e6600000000
0x14f20 <Pd+36640>: 0x2e66000000000084 0x0000000000841f0f
0x14f30 <Pd+36656>: 0x000000841f0f2e66 0x00841f0f2e660000
0x14f40 <Pd+36672>: 0x1f0f2e6600000000 0x2e66000000000084
0x14f50 <Pd+36688>: 0x0000000000841f0f 0x000000841f0f2e66
0x14f60 <Pd+36704>: 0x00841f0f2e660000 0x1f0f2e6600000000
0x14f70 <Pd+36720>: 0x2e66000000000084 0x0000000000841f0f
0x14f80 <Pd+36736>: 0x000000841f0f2e66 0x00841f0f2e660000
0x14f90 <Pd+36752>: 0x1f0f2e6600000000 0x2e66000000000084
0x14fa0 <Pd+36768>: 0x0000000000000020 0x0000000000008144
0x14fb0 <Pd+36784>: 0x0000000080000011 0x0000000000000020
0x14fc0 <Pd+36800>: 0x0000000000000020 0x0000000000000020
0x14fd0 <Pd+36816>: 0x0000000000000055 0x0000000000008123
0x14fe0 <Pd+36832>: 0x0000000000000010 0x0000000000000216
0x14ff0 <Pd+36848>: 0x0000000000015000 0x0000000000000010
现在我让它 运行 GP 处理头:
(gdb) break isr_head_13
Breakpoint 3 at 0x8236
(gdb) c
Continuing.
Breakpoint 3, 0x0000000000008236 in isr_head_13 ()
(gdb) bt
#0 0x0000000000008236 in isr_head_13 ()
#1 0x0000000000000010 in ?? ()
#2 0x00000000000081ae in isr_common.no_more_acks ()
#3 0x0000000000000008 in ?? ()
#4 0x0000000000000097 in ?? ()
#5 0x0000000000014fd8 in Pd ()
#6 0x0000000000000010 in ?? ()
#7 0x0000000000000055 in ?? ()
#8 0x0000000000008123 in LongMode.Nirv ()
#9 0x0000000000000010 in ?? ()
#10 0x0000000000000216 in ?? ()
#11 0x0000000000015000 in Pd ()
#12 0x0000000000000010 in ?? ()
我们看到它在带有选择器、标志和带有选择器的 return 地址的通常堆栈之后推送了错误代码 0x10,但有趣的是我来自计时器 (0x55) 的虚拟错误代码又回来了从死里。
我们已经知道它是由第一个 iretq 弹出的,这次我没有推送它:
(gdb) disas isr_head_13
Dump of assembler code for function isr_head_13:
=> 0x0000000000008236 <+0>: mov [=15=]xd,%eax
0x000000000000823b <+5>: push %rax
0x000000000000823c <+6>: jmpq 0x8189 <isr_common>
我想这只是 16 字节对齐,但我并没有真正参与其中。在计时器关闭之前,堆栈是 16 字节对齐的,但是 CPU 推送了奇数个 longlong。
那么它为什么会崩溃? Intel 文档说带有选择器的 GP 意味着它试图弹出超出范围的东西,但我没有看到这样的问题。
非常感谢任何帮助。
第一个IRET时栈上的CS选择器是10,是一个数据段,这就是导致#GP的原因。要么在处理程序中修改了堆栈(似乎不是这种情况),要么在更改 GDT 后未重新加载 CS 寄存器。
从 GP 处理程序 returns 到前一个 IRET 的 IRET,它会立即再次出现故障。除非您已经解决了故障,否则您通常不应该 return 来自故障处理程序。
好像没有保存和恢复handlers中的所有寄存器,一旦IRET开始工作就会出问题
我正在尝试编写 64 位 OS。它从定时器中断处理程序在 iretq 上抛出一个 GP,然后从 GP 处理程序的 iretq 重复抛出更多的 GP。
我知道这是因为我的通用处理程序在串行端口上打印了 ISR 编号,它变成了 32、13、13、13,...
GP的错误码是10,这是我的数据段。
我在qemu里调试,所以能看到不少。这是来自计时器处理程序的 iretq 的情况:
(gdb) disas isr_common,isr_head_2
Dump of assembler code from 0x8189 to 0x81c4:
0x0000000000008189 <isr_common+0>: callq 0x8125 <sayN100>
0x000000000000818e <isr_common+5>: cmp [=10=]x20,%eax
0x0000000000008191 <isr_common+8>: jl 0x81a8 <isr_common.no_more_acks>
0x0000000000008193 <isr_common+10>: cmp [=10=]x30,%eax
0x0000000000008196 <isr_common+13>: jge 0x81a8 <isr_common.no_more_acks>
0x0000000000008198 <isr_common+15>: cmp [=10=]x28,%al
0x000000000000819a <isr_common+17>: jl 0x81a2 <isr_common.ack_master>
0x000000000000819c <isr_common+19>: push %rax
0x000000000000819d <isr_common+20>: mov [=10=]x20,%al
0x000000000000819f <isr_common+22>: out %al,[=10=]xa0
0x00000000000081a1 <isr_common+24>: pop %rax
0x00000000000081a2 <isr_common.ack_master+0>: push %rax
0x00000000000081a3 <isr_common.ack_master+1>: mov [=10=]x20,%al
0x00000000000081a5 <isr_common.ack_master+3>: out %al,[=10=]x20
0x00000000000081a7 <isr_common.ack_master+5>: pop %rax
0x00000000000081a8 <isr_common.no_more_acks+0>: cmp [=10=]x24,%ax
0x00000000000081ac <isr_common.no_more_acks+4>: pop %rax
0x00000000000081ad <isr_common.no_more_acks+5>: pop %rax
=> 0x00000000000081ae <isr_common.end+0>: iretq
0x00000000000081b0 <isr_head_0+0>: pushq [=10=]x55 ;DUMMY ERROR CODE
0x00000000000081b2 <isr_head_0+2>: mov [=10=]x0,%eax
0x00000000000081b7 <isr_head_0+7>: push %rax
0x00000000000081b8 <isr_head_0+8>: jmp 0x8189 <isr_common>
0x00000000000081ba <isr_head_1+0>: pushq [=10=]x55 ;DUMMY ERROR CODE
0x00000000000081bc <isr_head_1+2>: mov [=10=]x1,%eax
0x00000000000081c1 <isr_head_1+7>: push %rax
0x00000000000081c2 <isr_head_1+8>: jmp 0x8189 <isr_common>
这显示了在 IDT 中输入的几个 "isr_head",可能会将虚拟错误代码和 jmp 推送到 isr_common。
(gdb) bt
#0 0x00000000000081ae in isr_common.end ()
#1 0x0000000000008123 in LongMode.Nirv ()
#2 0x0000000000000010 in ?? ()
#3 0x0000000000000216 in ?? ()
#4 0x0000000000015000 in Pd ()
#5 0x0000000000000010 in ?? ()
#6 0x000000b8e5894855 in ?? ()
#7 0x78bf00000332e800 in ?? ()
#8 0x000003e3e8000000 in ?? ()
其中:
0x0000000000008122 <LongMode.Nirv+0>: hlt
0x0000000000008123 <LongMode.Nirv+1>: jmp 0x8122 <LongMode.Nirv>
注意事项:
(gdb) info registers
rax 0x55 85
rbx 0x80000011 2147483665
rcx 0xc0000080 3221225600
rdx 0x3f8 1016
rsi 0xb 11
rdi 0x3fc 1020
rbp 0x0 0x0
rsp 0x14fd8 0x14fd8 <Pd+36824>
r8 0x0 0
r9 0x0 0
r10 0x0 0
r11 0x0 0
r12 0x0 0
r13 0x0 0
r14 0x0 0
r15 0x0 0
rip 0x81ae 0x81ae <isr_common.end>
eflags 0x97 [ CF PF AF SF ]
cs 0x8 8
ss 0x10 16
ds 0x10 16
es 0x10 16
fs 0x10 16
gs 0x10 16
(gdb) x/32xg 0x14f00
0x14f00 <Pd+36608>: 0x0000000000841f0f 0x000000841f0f2e66
0x14f10 <Pd+36624>: 0x00841f0f2e660000 0x1f0f2e6600000000
0x14f20 <Pd+36640>: 0x2e66000000000084 0x0000000000841f0f
0x14f30 <Pd+36656>: 0x000000841f0f2e66 0x00841f0f2e660000
0x14f40 <Pd+36672>: 0x1f0f2e6600000000 0x2e66000000000084
0x14f50 <Pd+36688>: 0x0000000000841f0f 0x000000841f0f2e66
0x14f60 <Pd+36704>: 0x00841f0f2e660000 0x1f0f2e6600000000
0x14f70 <Pd+36720>: 0x2e66000000000084 0x0000000000841f0f
0x14f80 <Pd+36736>: 0x000000841f0f2e66 0x00841f0f2e660000
0x14f90 <Pd+36752>: 0x1f0f2e6600000000 0x2e66000000000084
0x14fa0 <Pd+36768>: 0x0000000000000020 0x0000000000008144
0x14fb0 <Pd+36784>: 0x0000000080000011 0x0000000000000020
0x14fc0 <Pd+36800>: 0x0000000000000020 0x0000000000000020
0x14fd0 <Pd+36816>: 0x0000000000000055 0x0000000000008123
0x14fe0 <Pd+36832>: 0x0000000000000010 0x0000000000000216
0x14ff0 <Pd+36848>: 0x0000000000015000 0x0000000000000010
现在我让它 运行 GP 处理头:
(gdb) break isr_head_13
Breakpoint 3 at 0x8236
(gdb) c
Continuing.
Breakpoint 3, 0x0000000000008236 in isr_head_13 ()
(gdb) bt
#0 0x0000000000008236 in isr_head_13 ()
#1 0x0000000000000010 in ?? ()
#2 0x00000000000081ae in isr_common.no_more_acks ()
#3 0x0000000000000008 in ?? ()
#4 0x0000000000000097 in ?? ()
#5 0x0000000000014fd8 in Pd ()
#6 0x0000000000000010 in ?? ()
#7 0x0000000000000055 in ?? ()
#8 0x0000000000008123 in LongMode.Nirv ()
#9 0x0000000000000010 in ?? ()
#10 0x0000000000000216 in ?? ()
#11 0x0000000000015000 in Pd ()
#12 0x0000000000000010 in ?? ()
我们看到它在带有选择器、标志和带有选择器的 return 地址的通常堆栈之后推送了错误代码 0x10,但有趣的是我来自计时器 (0x55) 的虚拟错误代码又回来了从死里。 我们已经知道它是由第一个 iretq 弹出的,这次我没有推送它:
(gdb) disas isr_head_13
Dump of assembler code for function isr_head_13:
=> 0x0000000000008236 <+0>: mov [=15=]xd,%eax
0x000000000000823b <+5>: push %rax
0x000000000000823c <+6>: jmpq 0x8189 <isr_common>
我想这只是 16 字节对齐,但我并没有真正参与其中。在计时器关闭之前,堆栈是 16 字节对齐的,但是 CPU 推送了奇数个 longlong。
那么它为什么会崩溃? Intel 文档说带有选择器的 GP 意味着它试图弹出超出范围的东西,但我没有看到这样的问题。
非常感谢任何帮助。
第一个IRET时栈上的CS选择器是10,是一个数据段,这就是导致#GP的原因。要么在处理程序中修改了堆栈(似乎不是这种情况),要么在更改 GDT 后未重新加载 CS 寄存器。
从 GP 处理程序 returns 到前一个 IRET 的 IRET,它会立即再次出现故障。除非您已经解决了故障,否则您通常不应该 return 来自故障处理程序。
好像没有保存和恢复handlers中的所有寄存器,一旦IRET开始工作就会出问题