xv6 引导加载程序:使用 CHS 从磁盘读取扇区

xv6 boot loader: Reading sectors off disk using CHS

我一直在努力思考 xv6 引导加载程序的 C 部分(问题在代码下方)

void
bootmain(void)
{
  struct elfhdr *elf;
  struct proghdr *ph, *eph;
  void (*entry)(void);
  uchar* pa;

  elf = (struct elfhdr*)0x10000;  // scratch space

  // Read 1st page off disk
  readseg((uchar*)elf, 4096, 0);

  // Is this an ELF executable?
  if(elf->magic != ELF_MAGIC)
    return;  // let bootasm.S handle error

  // Load each program segment (ignores ph flags).
  ph = (struct proghdr*)((uchar*)elf + elf->phoff);
  eph = ph + elf->phnum;
  for(; ph < eph; ph++){
    pa = (uchar*)ph->paddr;
    readseg(pa, ph->filesz, ph->off);
    if(ph->memsz > ph->filesz)
      stosb(pa + ph->filesz, 0, ph->memsz - ph->filesz);
  }

  // Call the entry point from the ELF header.
  // Does not return!
  entry = (void(*)(void))(elf->entry);
  entry();
}

void
waitdisk(void)
{
  // Wait for disk ready.
  while((inb(0x1F7) & 0xC0) != 0x40)
    ;
}

// Read a single sector at offset into dst.
void
readsect(void *dst, uint offset)
{
  // Issue command.
  waitdisk();
  outb(0x1F2, 1);   // count = 1
  outb(0x1F3, offset);
  outb(0x1F4, offset >> 8);
  outb(0x1F5, offset >> 16);
  outb(0x1F6, (offset >> 24) | 0xE0);
  outb(0x1F7, 0x20);  // cmd 0x20 - read sectors

  // Read data.
  waitdisk();
  insl(0x1F0, dst, SECTSIZE/4);
}

// Read 'count' bytes at 'offset' from kernel into physical address 'pa'.
// Might copy more than asked.
void
readseg(uchar* pa, uint count, uint offset)
{
  uchar* epa;

  epa = pa + count;

  // Round down to sector boundary.
  pa -= offset % SECTSIZE;

  // Translate from bytes to sectors; kernel starts at sector 1.
  offset = (offset / SECTSIZE) + 1;

  // If this is too slow, we could read lots of sectors at a time.
  // We'd write more to memory than asked, but it doesn't matter --
  // we load in increasing order.
  for(; pa < epa; pa += SECTSIZE, offset++)
    readsect(pa, offset);
}

所以它使用CHS addressing scheme,即它输出扇区索引、柱面号和磁头号到磁盘端口并发出读取命令(参见readsect(dst, offset))。

该函数采用的 offset 参数应该包含从磁盘开始的扇区偏移量。例如。如果您传递 0x01000203 作为偏移量(16777731 十进制),它将把它分成 0x03 作为扇区索引,0x0002 作为柱面号,以及 0x01作为头号。问题是扇区索引不能从0x000xFF,只能从0x010x3F163 十进制),所以这个寻址方案是不连续的。例如,offset 0x100002EE 将无效,因为没有扇区索引 0xEE.

我不是很明白内核是如何仍然成功加载到内存中的。在 readseg() 函数中很明显,您可以将任何内存偏移量传递给它,它会将其转换为扇区偏移量并传递给 readsect(),可能会传递无效的扇区索引。如果内核大小从未超过 63 * 512 = 32256 字节,因此永远不会达到无效扇区索引,那会很好,但实际上大约是 170k。

这是怎么回事?

What is going on?

硬盘没有使用CHS寻址,而是使用(28位)LBA寻址。在这种情况下,IDE/ATA 控制器的寄存器本来是 "sector, cylinder low, cylinder high, head" 在 CHS 模式下变成了 "LBA bits 0 to 7, LBA bits 8 to 15, LBA bits 16 to 23, LBA bits 24 to 27"。

请注意,此代码仍然非常糟糕(例如,不检查读取命令是否返回错误,可能对许多硬件的存在和配置等做出了疯狂的假设);真正的引导加载程序无法做出这些假设,并且主要需要使用固件从磁盘加载数据(因为引导加载程序支持所有 RAID 控制器,AHCI/SATA,SCSI 控制器,USB 控制器和设备,. ..).然而,Xv6 是一个 "teaching OS"(这主要意味着它教给你一些糟糕的想法和废话,目的是将知识的幻觉塞进大约 3 个月的时间跨度)。