设置 std::threads 的线程亲和性
Setting Thread Affinity of std::threads
我正在尝试弄清楚如何使用 win32 API 设置 std::thread 或 boost::thread 的线程关联。我想使用 SetThreadAffinityMask 函数将每个线程固定到我机器中的特定内核。
我使用thread native_handle 成员函数来获取提供给SetThreadAffinityMask 函数的线程句柄。但是,这样做会导致 SetThreadAffinityMask 函数返回 0,表示设置线程亲和性失败。
unsigned numCores = std::thread::hardware_concurrency();
std::vector<std::thread> threads(numCores);
for (int i = 0; i < numCores; i++)
{
threads.push_back(std::thread(workLoad, i));
cout << "Original Thread Affinity Mask: " << SetThreadAffinityMask(threads[i].native_handle() , 1 << i) << endl;
}
for (thread& t : threads)
{
if (t.joinable())
t.join();
}
原始线程亲和性掩码:0
原始线程亲和性掩码:0
原始线程亲和性掩码:0
原始线程亲和性掩码:0
原始线程亲和性掩码:0
原始线程亲和性掩码:0
原始线程亲和性掩码:0
...等等
您的问题是 threads
的初始设置包含 numCores
default-initialized 条目。您的新(阅读:真实)线程随后被推送到向量上,但您在设置亲和力时永远不会对它们进行索引。相反,您使用 i
进行索引,它只是在真正的线程之前命中向量中不是真正 运行 线程的对象。
下面显示的是实际上 run-worthy 的更正版本:
#include <iostream>
#include <vector>
#include <thread>
#include <chrono>
#include <windows.h>
void proc(void)
{
using namespace std::chrono_literals;
std::this_thread::sleep_for(5s);
}
int main()
{
std::vector<std::thread> threads;
for (unsigned int i = 0; i < std::thread::hardware_concurrency(); ++i)
{
threads.emplace_back(proc);
DWORD_PTR dw = SetThreadAffinityMask(threads.back().native_handle(), DWORD_PTR(1) << i);
if (dw == 0)
{
DWORD dwErr = GetLastError();
std::cerr << "SetThreadAffinityMask failed, GLE=" << dwErr << '\n';
}
}
for (auto& t : threads)
t.join();
}
我正在尝试弄清楚如何使用 win32 API 设置 std::thread 或 boost::thread 的线程关联。我想使用 SetThreadAffinityMask 函数将每个线程固定到我机器中的特定内核。
我使用thread native_handle 成员函数来获取提供给SetThreadAffinityMask 函数的线程句柄。但是,这样做会导致 SetThreadAffinityMask 函数返回 0,表示设置线程亲和性失败。
unsigned numCores = std::thread::hardware_concurrency();
std::vector<std::thread> threads(numCores);
for (int i = 0; i < numCores; i++)
{
threads.push_back(std::thread(workLoad, i));
cout << "Original Thread Affinity Mask: " << SetThreadAffinityMask(threads[i].native_handle() , 1 << i) << endl;
}
for (thread& t : threads)
{
if (t.joinable())
t.join();
}
原始线程亲和性掩码:0
原始线程亲和性掩码:0
原始线程亲和性掩码:0
原始线程亲和性掩码:0
原始线程亲和性掩码:0
原始线程亲和性掩码:0
原始线程亲和性掩码:0
...等等
您的问题是 threads
的初始设置包含 numCores
default-initialized 条目。您的新(阅读:真实)线程随后被推送到向量上,但您在设置亲和力时永远不会对它们进行索引。相反,您使用 i
进行索引,它只是在真正的线程之前命中向量中不是真正 运行 线程的对象。
下面显示的是实际上 run-worthy 的更正版本:
#include <iostream>
#include <vector>
#include <thread>
#include <chrono>
#include <windows.h>
void proc(void)
{
using namespace std::chrono_literals;
std::this_thread::sleep_for(5s);
}
int main()
{
std::vector<std::thread> threads;
for (unsigned int i = 0; i < std::thread::hardware_concurrency(); ++i)
{
threads.emplace_back(proc);
DWORD_PTR dw = SetThreadAffinityMask(threads.back().native_handle(), DWORD_PTR(1) << i);
if (dw == 0)
{
DWORD dwErr = GetLastError();
std::cerr << "SetThreadAffinityMask failed, GLE=" << dwErr << '\n';
}
}
for (auto& t : threads)
t.join();
}