使用 VMX 模拟内存映射 I/O 是否需要指令解码?

Does simulating memory-mapped I/O using VMX require instruction decoding?

我想知道使用 Intel 的 VMX / VT 技术的管理程序如何模拟内存映射 I/O(以便来宾可以认为它正在针对设备执行内存映射 I/O)。

我认为基本原则是以这样一种方式设置 EPT 页表,即通过将它们设置为无法读取或写入,所讨论的内存地址会导致 EPT 违规(即 VM 退出) ?然而,接下来的问题是如何处理虚拟机退出。这样的 VM 退出将填写所有退出资格原因等,包括客户线性地址和客户物理地址等。但我在这些退出资格字段中缺少的是一些字段,指示 - 在写指令的情况下 -试图写入的值和写入的大小。同样,对于读取指令,最好使用一些指示读取目标的位字段,例如寄存器或内存位置(在内存到内存字符串操作的情况下)。这将使管理程序很容易弄清楚来宾试图做什么,然后模拟针对来宾的设备行为。

但问题是,我在退出条件中找不到这样的字段。我可以看到指向错误指令位置的指令指针,因此我可以遍历页表以读入指令,然后对其进行解码以理解指令,然后模拟 I/O 行为。然而,这需要管理程序对所有 x86 指令有相当完整的了解,并能够对其进行解码。这对管理程序来说似乎是一个沉重的负担,并且还需要它与以后的指令添加保持同步。而 CPU 应该已经有了这些信息。

我有可能遗漏了这些相关字段,因为文档非常广泛,但我试图仔细搜索但未能找到它。也许有人可以为我指出正确的方向,或者确认管理程序需要包含指令解码器。

我相信大多数 VM 都会解码指令。这实际上并没有那么难,而且大多数 VM 都有软件模拟器,当 CPU VM 扩展不可用或无法完成任务时可以回退。您不需要处理每条指令,只需处理那些可以采用内存操作数的指令,并且您可能会忽略所有不是 1、2 或 4 字节内存操作数的指令,因为您不太可能模拟设备寄存器,除了那些尺寸。 (对于内存映射设备缓冲区,如视频内存,您​​不希望捕获每次内存访问,因为那太慢了,因此您必须采取不同的方法。)

但是,有一种方法可以让 CPU 为您完成工作,但它比解码指令本身要慢得多,而且并不完全完美。您可以单步执行指令,同时临时映射到有效的 RAM 页中。 VM 出口将告诉您来宾物理地址访问以及它是读还是写。不幸的是,它不能可靠地告诉您它是否是读-修改-写指令,这些指令可能只是设置写标志,并且某些设备寄存器可能会有所不同。复制指令(它最多只能是 15 个字节,但要注意页面边界)并在主机中执行它可能更容易,但这要求您可以将页面映射到主机中的相同虚拟地址客人.

您可以结合这些技术,解码实际用于访问内存映射设备寄存器的通用指令,同时对您不认识的指令使用单步执行。

请注意,选择编写自己的管理程序会给自己带来沉重的负担。与模拟整个 IBM PC 兼容计算机的任务相比,必须解码软件中的指令是一个非常小的负担。 Intel 虚拟化扩展并不是为了让这一切变得更容易而设计的,它们只是为了提高效率而设计的。编写一个解释指令的纯软件模拟器会更容易。处理内存映射 I/O 只是将读取和写入分派到正确的函数的问题。

我不知道 VT-X 是如何工作的细节,但我认为我在你的愿望清单中看到了一个缺陷:

请记住 x86 不是 load/store 机器。 add [rdi], 2 的加载部分没有体系结构可见的目的地,因此您建议的告诉管理程序在哪里查找或放置数据的解决方案实际上行不通,除非有一些不属于来宾架构状态的临时位置,仅用于管理程序和 VMX 硬件之间的通信。

为了有效地处理带有内存目标的读取-修改-写入指令,VM 应该在一个 VM 退出时完成整个操作。所以你不能只提供单独的加载和存储接口。

更重要的是,处理原子读取-修改-写入是一种特殊情况。 lock add [rdi], 2 不能仅作为单独的加载和存储来完成。