设置 std::threads 的线程亲和性

Setting Thread Affinity of std::threads

我正在尝试弄清楚如何使用 win32 API 设置 std::thread 或 boost::thread 的线程关联。我想使用 SetThreadAffinityMask 函数将每个线程固定到我机器中的特定内核。

我使用thread native_handle 成员函数来获取提供给SetThreadAffinityMask 函数的线程句柄。但是,这样做会导致 SetThreadAffinityMask 函数返回 0,表示设置线程亲和性失败。

unsigned numCores = std::thread::hardware_concurrency();
std::vector<std::thread> threads(numCores);

for (int i = 0; i < numCores; i++)
{
    threads.push_back(std::thread(workLoad, i));
    cout << "Original Thread Affinity Mask: " << SetThreadAffinityMask(threads[i].native_handle() , 1 << i) << endl;

}

for (thread& t : threads)
{
    if (t.joinable())
        t.join();
}

原始线程亲和性掩码:0

原始线程亲和性掩码:0

原始线程亲和性掩码:0

原始线程亲和性掩码:0

原始线程亲和性掩码:0

原始线程亲和性掩码:0

原始线程亲和性掩码:0

...等等

您的问题是 threads 的初始设置包含 numCores default-initialized 条目。您的新(阅读:真实)线程随后被推送到向量上,但您在设置亲和力时永远不会对它们进行索引。相反,您使用 i 进行索引,它只是在真正的线程之前命中向量中不是真正 运行 线程的对象。

下面显示的是实际上 run-worthy 的更正版本:

#include <iostream>
#include <vector>
#include <thread>
#include <chrono>

#include <windows.h>

void proc(void)
{
    using namespace std::chrono_literals;
    std::this_thread::sleep_for(5s);
}

int main()
{
    std::vector<std::thread> threads;
    for (unsigned int i = 0; i < std::thread::hardware_concurrency(); ++i)
    {
        threads.emplace_back(proc);
        DWORD_PTR dw = SetThreadAffinityMask(threads.back().native_handle(), DWORD_PTR(1) << i);
        if (dw == 0)
        {
            DWORD dwErr = GetLastError();
            std::cerr << "SetThreadAffinityMask failed, GLE=" << dwErr << '\n';
        }
    }

    for (auto& t : threads)
        t.join();
}