32位架构中的DS段寄存器
DS segment register in 32 bit architecture
我一直在研究如何通过反汇编 C 代码在 x86 体系结构中处理浮点运算。 OS 使用的是 64 位 linux,而代码是为 32 位机器编译的。
这是 C 源代码:
#include <stdio.h>
#include <float.h>
int main(int argc, char *argv[])
{
float a, b;
float c, d;
printf("%u\n",sizeof(float));
a = FLT_MAX;
b = 5;
c = a / b;
d = (float) a / (float) b;
printf("%f %f \n",c,d);
return 0;
}
这里是32位exe主要功能的反汇编版本:
804841c: 55 push ebp
804841d: 89 e5 mov ebp,esp
804841f: 83 e4 f0 and esp,0xfffffff0
8048422: 83 ec 30 sub esp,0x30
8048425: c7 44 24 04 04 00 00 mov DWORD PTR [esp+0x4],0x4
804842c: 00
804842d: c7 04 24 20 85 04 08 mov DWORD PTR [esp],0x8048520
8048434: e8 b7 fe ff ff call 80482f0 <printf@plt>
8048439: a1 2c 85 04 08 mov eax,ds:0x804852c
804843e: 89 44 24 2c mov DWORD PTR [esp+0x2c],eax
8048442: a1 30 85 04 08 mov eax,ds:0x8048530
8048447: 89 44 24 28 mov DWORD PTR [esp+0x28],eax
804844b: d9 44 24 2c fld DWORD PTR [esp+0x2c]
804844f: d8 74 24 28 fdiv DWORD PTR [esp+0x28]
8048453: d9 5c 24 24 fstp DWORD PTR [esp+0x24]
8048457: d9 44 24 2c fld DWORD PTR [esp+0x2c]
804845b: d8 74 24 28 fdiv DWORD PTR [esp+0x28]
804845f: d9 5c 24 20 fstp DWORD PTR [esp+0x20]
8048463: d9 44 24 20 fld DWORD PTR [esp+0x20]
8048467: d9 44 24 24 fld DWORD PTR [esp+0x24]
804846b: d9 c9 fxch st(1)
804846d: dd 5c 24 0c fstp QWORD PTR [esp+0xc]
8048471: dd 5c 24 04 fstp QWORD PTR [esp+0x4]
8048475: c7 04 24 24 85 04 08 mov DWORD PTR [esp],0x8048524
804847c: e8 6f fe ff ff call 80482f0 <printf@plt>
8048481: b8 00 00 00 00 mov eax,0x0
8048486: c9 leave
8048487: c3 ret
8048488: 66 90 xchg ax,ax
804848a: 66 90 xchg ax,ax
804848c: 66 90 xchg ax,ax
804848e: 66 90 xchg ax,ax
我难以理解的是将浮点值传输到寄存器的行。具体来说:
mov eax,ds:0x804852c
mov eax,ds:0x8048530
在我的理解中,指令应该分别等于 mov eax,[0x804852c] 和 mov eax,[0x8048530] 因为在 32 位模式下 ds 寄存器通常指向整个 32 位 space 和通常为 0。但是,当我检查寄存器值时,ds 不是 0。它的值为
ds 0x2b
鉴于该值,计算不应该是
0x2b *0x10 + 0x8048520
然而,浮点数存储在 0x8048520 和 0x8048530 中,这就像在 DS 中的值为 0。谁能向我解释这是为什么?
DS 在保护模式下的工作方式完全不同。它不是线性地址的移位部分,就像在实模式中一样,它是段 table 的索引,其中包含段的基地址。 OS 内核维护段 table,用户态代码不能。
就是说,请忽略 ds: 前缀。反汇编程序明确说明了默认行为,仅此而已。该命令默认使用 DS 作为选择器;所以反汇编程序认为它会提到。 OS 会将 DS 初始化为对流程有意义的值,并且在整个流程中将使用相同的 DS 值。
由于代码是 32 位保护模式,DS 寄存器用作 table 的索引,如 Seva 所述。这称为 GDT 或 LDT,具体取决于它是进程的全局还是本地。全局描述符 Table & 局部描述符 Table.
每个条目指定许多不同的参数。这些包括描述的内存区域的基础、限制和粒度、访问类型和特权级别。
完全有可能有两个在各个方面都相同的描述符 - 它们显然在 table 中具有不同的索引,并且会导致不同的 DS 值。
--
它还允许您访问位于地址 space 中任何位置的内存,就像它位于内存的最底部一样。以卡的线性帧缓冲器的视频内存为例。不同的卡实现会将其定位在不同的地址,但由于描述符中的基字段,您仍然可以以完全透明的方式访问这些不同的区域。
我有一张卡定位内存在0xE0000000,而另一张卡定位在0xC0000000。现在我可以在查询卡后将这个地址保存到一个全局变量中,然后在任何绘图操作中加载这个变量并将它添加到计算的区域偏移量中。幸运的是,描述符机制允许我们做得比这更好。
当我设置 GDT 时,我使用从卡返回的值来指定内存区域的基数,该内存区域将被 table 中特定位置的描述符引用,从而制作绘图代码不知道或不关心帧缓冲区在物理内存中的位置。
访问这个就像
一样简单
push es
mov ax, LinearFrameBufferSel
mov es, ax
在指定内存位置的同时,我可以像这样将要加载的数据硬编码为 GDT:
; point to memory r/w at E000 0000 - this should not be hard-coded! we should get the value from the video card, using VBE extension functions
; accessed with ds=40
LinearFrameBufferSel equ $ - gdt
dw 0xffff ; limit low ; [0-15] - index 40
dw 0x0000 ; base low ; [0-15]
db 0x00 ; base middle ; [16-23]
db 0x92 ; access ;
db 0xCF ; granularity ; flags(4) - limit(4) [16-19]
db 0xE0 ; base hi
; ; point to memory r/w at 000A 0000 ; index 48
; ; accessed with ds=48
BankedVidMemSel equ $ - gdt
dw 0xffff ; limit low ; [0-15]
dw 0x0000 ; base low ; [0-15]
db 0x0A ; base middle ; [16-23]
db 0x92 ; access ;
db 0xCF ; granularity ; flags(4) - limit(4) [16-19]
db 0x00 ; base hi
; ; point to memory r/w at 000B 8000 ; index 56
; ; accessed with ds=56
TextVidMemSel equ $ - gdt
dw 0xffff ; limit low ; [0-15]
dw 0x8000 ; base low ; [0-15]
db 0x0B ; base middle ; [16-23]
db 0x92 ; access ;
db 0xCF ; granularity ; flags(4) - limit(4) [16-19]
db 0x00 ; base hi
VideoBackBufferSel equ $ - gdt ; point to memory 0x800000 lower than 0xE0000000 ( = 8meg lower than 3 gig )
dw 0xffff ; limit low ; [0-15]
dw 0x0000 ; base low ; [0-15]
db 0x20 ; base middle ; [16-23]
db 0x92 ; access ;
db 0xCF ; granularity ; flags(4) - limit(4) [16-19]
db 0x00 ; base hi
快速而肮脏,但不令人满意。一个更好的方法是声明一个 table 然后使用辅助函数来设置任何特定条目的值:
static void init_gdt()
{
gdt_ptr.limit = (sizeof(gdt_entry_t) * 5) - 1;
gdt_ptr.base = (u32int)&gdt_entries;
gdt_set_gate(0, 0, 0, 0, 0); // Null segment
gdt_set_gate(1, 0, 0xFFFFFFFF, 0x9A, 0xCF); // Code segment
gdt_set_gate(2, 0, 0xFFFFFFFF, 0x92, 0xCF); // Data segment
gdt_set_gate(3, 0, 0xFFFFFFFF, 0xFA, 0xCF); // User mode code segment
gdt_set_gate(4, 0, 0xFFFFFFFF, 0xF2, 0xCF); // User mode data segment
gdt_flush((u32int)&gdt_ptr);
}
所有这些描述符都指向相同的内存区域,但需要 DS 值 8、16、24 和 32(第一个条目未使用 - 每个条目的大小为 8 个字节)
我一直在研究如何通过反汇编 C 代码在 x86 体系结构中处理浮点运算。 OS 使用的是 64 位 linux,而代码是为 32 位机器编译的。
这是 C 源代码:
#include <stdio.h>
#include <float.h>
int main(int argc, char *argv[])
{
float a, b;
float c, d;
printf("%u\n",sizeof(float));
a = FLT_MAX;
b = 5;
c = a / b;
d = (float) a / (float) b;
printf("%f %f \n",c,d);
return 0;
}
这里是32位exe主要功能的反汇编版本:
804841c: 55 push ebp
804841d: 89 e5 mov ebp,esp
804841f: 83 e4 f0 and esp,0xfffffff0
8048422: 83 ec 30 sub esp,0x30
8048425: c7 44 24 04 04 00 00 mov DWORD PTR [esp+0x4],0x4
804842c: 00
804842d: c7 04 24 20 85 04 08 mov DWORD PTR [esp],0x8048520
8048434: e8 b7 fe ff ff call 80482f0 <printf@plt>
8048439: a1 2c 85 04 08 mov eax,ds:0x804852c
804843e: 89 44 24 2c mov DWORD PTR [esp+0x2c],eax
8048442: a1 30 85 04 08 mov eax,ds:0x8048530
8048447: 89 44 24 28 mov DWORD PTR [esp+0x28],eax
804844b: d9 44 24 2c fld DWORD PTR [esp+0x2c]
804844f: d8 74 24 28 fdiv DWORD PTR [esp+0x28]
8048453: d9 5c 24 24 fstp DWORD PTR [esp+0x24]
8048457: d9 44 24 2c fld DWORD PTR [esp+0x2c]
804845b: d8 74 24 28 fdiv DWORD PTR [esp+0x28]
804845f: d9 5c 24 20 fstp DWORD PTR [esp+0x20]
8048463: d9 44 24 20 fld DWORD PTR [esp+0x20]
8048467: d9 44 24 24 fld DWORD PTR [esp+0x24]
804846b: d9 c9 fxch st(1)
804846d: dd 5c 24 0c fstp QWORD PTR [esp+0xc]
8048471: dd 5c 24 04 fstp QWORD PTR [esp+0x4]
8048475: c7 04 24 24 85 04 08 mov DWORD PTR [esp],0x8048524
804847c: e8 6f fe ff ff call 80482f0 <printf@plt>
8048481: b8 00 00 00 00 mov eax,0x0
8048486: c9 leave
8048487: c3 ret
8048488: 66 90 xchg ax,ax
804848a: 66 90 xchg ax,ax
804848c: 66 90 xchg ax,ax
804848e: 66 90 xchg ax,ax
我难以理解的是将浮点值传输到寄存器的行。具体来说:
mov eax,ds:0x804852c
mov eax,ds:0x8048530
在我的理解中,指令应该分别等于 mov eax,[0x804852c] 和 mov eax,[0x8048530] 因为在 32 位模式下 ds 寄存器通常指向整个 32 位 space 和通常为 0。但是,当我检查寄存器值时,ds 不是 0。它的值为
ds 0x2b
鉴于该值,计算不应该是
0x2b *0x10 + 0x8048520
然而,浮点数存储在 0x8048520 和 0x8048530 中,这就像在 DS 中的值为 0。谁能向我解释这是为什么?
DS 在保护模式下的工作方式完全不同。它不是线性地址的移位部分,就像在实模式中一样,它是段 table 的索引,其中包含段的基地址。 OS 内核维护段 table,用户态代码不能。
就是说,请忽略 ds: 前缀。反汇编程序明确说明了默认行为,仅此而已。该命令默认使用 DS 作为选择器;所以反汇编程序认为它会提到。 OS 会将 DS 初始化为对流程有意义的值,并且在整个流程中将使用相同的 DS 值。
由于代码是 32 位保护模式,DS 寄存器用作 table 的索引,如 Seva 所述。这称为 GDT 或 LDT,具体取决于它是进程的全局还是本地。全局描述符 Table & 局部描述符 Table.
每个条目指定许多不同的参数。这些包括描述的内存区域的基础、限制和粒度、访问类型和特权级别。
完全有可能有两个在各个方面都相同的描述符 - 它们显然在 table 中具有不同的索引,并且会导致不同的 DS 值。
--
它还允许您访问位于地址 space 中任何位置的内存,就像它位于内存的最底部一样。以卡的线性帧缓冲器的视频内存为例。不同的卡实现会将其定位在不同的地址,但由于描述符中的基字段,您仍然可以以完全透明的方式访问这些不同的区域。
我有一张卡定位内存在0xE0000000,而另一张卡定位在0xC0000000。现在我可以在查询卡后将这个地址保存到一个全局变量中,然后在任何绘图操作中加载这个变量并将它添加到计算的区域偏移量中。幸运的是,描述符机制允许我们做得比这更好。
当我设置 GDT 时,我使用从卡返回的值来指定内存区域的基数,该内存区域将被 table 中特定位置的描述符引用,从而制作绘图代码不知道或不关心帧缓冲区在物理内存中的位置。
访问这个就像
一样简单 push es
mov ax, LinearFrameBufferSel
mov es, ax
在指定内存位置的同时,我可以像这样将要加载的数据硬编码为 GDT:
; point to memory r/w at E000 0000 - this should not be hard-coded! we should get the value from the video card, using VBE extension functions
; accessed with ds=40
LinearFrameBufferSel equ $ - gdt
dw 0xffff ; limit low ; [0-15] - index 40
dw 0x0000 ; base low ; [0-15]
db 0x00 ; base middle ; [16-23]
db 0x92 ; access ;
db 0xCF ; granularity ; flags(4) - limit(4) [16-19]
db 0xE0 ; base hi
; ; point to memory r/w at 000A 0000 ; index 48
; ; accessed with ds=48
BankedVidMemSel equ $ - gdt
dw 0xffff ; limit low ; [0-15]
dw 0x0000 ; base low ; [0-15]
db 0x0A ; base middle ; [16-23]
db 0x92 ; access ;
db 0xCF ; granularity ; flags(4) - limit(4) [16-19]
db 0x00 ; base hi
; ; point to memory r/w at 000B 8000 ; index 56
; ; accessed with ds=56
TextVidMemSel equ $ - gdt
dw 0xffff ; limit low ; [0-15]
dw 0x8000 ; base low ; [0-15]
db 0x0B ; base middle ; [16-23]
db 0x92 ; access ;
db 0xCF ; granularity ; flags(4) - limit(4) [16-19]
db 0x00 ; base hi
VideoBackBufferSel equ $ - gdt ; point to memory 0x800000 lower than 0xE0000000 ( = 8meg lower than 3 gig )
dw 0xffff ; limit low ; [0-15]
dw 0x0000 ; base low ; [0-15]
db 0x20 ; base middle ; [16-23]
db 0x92 ; access ;
db 0xCF ; granularity ; flags(4) - limit(4) [16-19]
db 0x00 ; base hi
快速而肮脏,但不令人满意。一个更好的方法是声明一个 table 然后使用辅助函数来设置任何特定条目的值:
static void init_gdt()
{
gdt_ptr.limit = (sizeof(gdt_entry_t) * 5) - 1;
gdt_ptr.base = (u32int)&gdt_entries;
gdt_set_gate(0, 0, 0, 0, 0); // Null segment
gdt_set_gate(1, 0, 0xFFFFFFFF, 0x9A, 0xCF); // Code segment
gdt_set_gate(2, 0, 0xFFFFFFFF, 0x92, 0xCF); // Data segment
gdt_set_gate(3, 0, 0xFFFFFFFF, 0xFA, 0xCF); // User mode code segment
gdt_set_gate(4, 0, 0xFFFFFFFF, 0xF2, 0xCF); // User mode data segment
gdt_flush((u32int)&gdt_ptr);
}
所有这些描述符都指向相同的内存区域,但需要 DS 值 8、16、24 和 32(第一个条目未使用 - 每个条目的大小为 8 个字节)