用户模式和内核之间使用共享内存的缓慢通信

Question

我是运行 Windows 内核中的一个线程，通过共享内存与应用程序通信。除了由于睡眠循环导致通信速度变慢外，一切正常。我一直在研究自旋锁、互斥锁和互锁锁，但无法真正弄清楚这一点。我也考虑过 Windows 事件，但不知道那个事件的表现。请建议什么是更快的解决方案，通过共享内存保持通信可能会提示 Windows 个事件。

内核代码

typedef struct _SHARED_MEMORY
{
    BOOLEAN mutex;
    CHAR data[BUFFER_SIZE];
} SHARED_MEMORY, *PSHARED_MEMORY;

ZwCreateSection(...)
ZwMapViewOfSection(...)

while (TRUE) {
    if (((PSHARED_MEMORY)SharedSection)->mutex == TRUE) {
      //... do work...
      ((PSHARED_MEMORY)SharedSection)->mutex = FALSE;
    }
    KeDelayExecutionThread(KernelMode, FALSE, &PollingInterval);
}

申请代码

OpenFileMapping(...)
MapViewOfFile(...)

...

RtlCopyMemory(&SM->data, WriteData, Size);
SM->mutex = TRUE;

while (SM->mutex != FALSE) {
    Sleep(1); // Slow and removing it will cause an infinite loop
}

RtlCopyMemory(ReadData, &SM->data, Size);

更新 1 目前这是我想出的最快的解决方案：

while(InterlockedCompareExchange(&SM->mutex, FALSE, FALSE));

但是我觉得很有趣，你需要做一个交换，而且没有只有比较的功能。

Answer 1

您不想使用 InterlockedCompareExchange。它会消耗 CPU，使共享该物理内核的另一个线程可能需要的内核资源饱和，并且会使内核间总线饱和。

您确实需要做两件事：

1) 编写一个InterlockedGet函数并使用它。

2) 防止循环消耗 CPU 资源，并防止循环在最终解除阻塞时占用所有预测错误的分支。

对于 1，已知这适用于所有支持 InterlockedCompareExchange 的编译器，至少我上次检查时是这样：

__inline static int InterlockedGet(int *val)
{
    return *((volatile int *)val);
}

对于 2，将其作为等待循环的主体：

__asm
{
    rep nop
}

对于x86 CPUs，这是为了解决资源饱和和分支预测问题。

放在一起：

while ((*(volatile int *) &SM->mutex) != FALSE) {
    __asm
    {
        rep nop
    }
}

如果不合适，请根据需要更改 int。

用户模式和内核之间使用共享内存的缓慢通信

Slow communication using shared memory between user mode and kernel

c++

windows

kernel

mutex

spinlock