如何使用 OpenMP 以线程安全的方式生成随机数
How to generate random numbers in a thread safe way with OpenMP
在并行化之前,我在循环外创建了一个 default_random_engine
对象,因为创建这样的对象并不便宜。我在循环中重复使用它。
在与 OpenMP
并行化时,我注意到 uniform_dist(engine)
对随机引擎进行了可变引用,我认为这不是线程安全的。
程序没有崩溃,但我担心它的正确性。
我假设 random_device
是线程安全的,所以我可以将 default_random_engine
的定义移动到循环中,但我不想每次迭代都创建一个随机引擎对象,因为我读到了那可不便宜。
我认为另一种方法是创建一个 default_random_engine
对象的数组(大小:线程数)并使用 OpenMP 函数 select 开头的正确对象每次迭代基于线程 ID。
有没有更好的方法?
#include <iostream>
#include <random>
using namespace std;
int main() {
int N = 1000;
vector<int> v(N);
random_device r;
default_random_engine engine(r());
#pragma omp parallel for
for (int i = 0; i < N; ++i) {
uniform_int_distribution<int> uniform_dist(1, 100);
// Perform heavy calculations
v[i] = uniform_dist(engine); // I assume this is thread unsafe
}
return 0;
}
由于实际代码将随机引擎传递给许多函数(每个函数都从不同的分布生成整数和实数),我选择了每个线程的生成器数组,因为它对代码库的改动最少:
#include <iostream>
#include <omp.h>
#include <vector>
#include <random>
using namespace std;
int main() {
random_device r;
std::vector<std::default_random_engine> generators;
for (int i = 0, N = omp_get_max_threads(); i < N; ++i) {
generators.emplace_back(default_random_engine(r()));
}
int N = 1000;
vector<int> v(N);
#pragma omp parallel for
for (int i = 0; i < N; ++i) {
// Get the generator based on thread id
default_random_engine& engine = generators[omp_get_thread_num()];
// Perform heavy calculations
uniform_int_distribution<int> uniform_dist(1, 100);
v[i] = uniform_dist(engine); // I assume this is thread unsafe
}
return 0;
}
请记住,此代码假定函数 omp_set_num_threads
永远不会在程序中被调用。如果发生这种情况,线程将有可能获得比旧 omp_get_max_threads()
更大的数字 (omp_get_thread_num()
),这会导致缓冲区溢出错误。
遗憾的是,此解决方案采用了标准 不需要的实施细节。
在并行化之前,我在循环外创建了一个 default_random_engine
对象,因为创建这样的对象并不便宜。我在循环中重复使用它。
在与 OpenMP
并行化时,我注意到 uniform_dist(engine)
对随机引擎进行了可变引用,我认为这不是线程安全的。
程序没有崩溃,但我担心它的正确性。
我假设 random_device
是线程安全的,所以我可以将 default_random_engine
的定义移动到循环中,但我不想每次迭代都创建一个随机引擎对象,因为我读到了那可不便宜。
我认为另一种方法是创建一个 default_random_engine
对象的数组(大小:线程数)并使用 OpenMP 函数 select 开头的正确对象每次迭代基于线程 ID。
有没有更好的方法?
#include <iostream>
#include <random>
using namespace std;
int main() {
int N = 1000;
vector<int> v(N);
random_device r;
default_random_engine engine(r());
#pragma omp parallel for
for (int i = 0; i < N; ++i) {
uniform_int_distribution<int> uniform_dist(1, 100);
// Perform heavy calculations
v[i] = uniform_dist(engine); // I assume this is thread unsafe
}
return 0;
}
由于实际代码将随机引擎传递给许多函数(每个函数都从不同的分布生成整数和实数),我选择了每个线程的生成器数组,因为它对代码库的改动最少:
#include <iostream>
#include <omp.h>
#include <vector>
#include <random>
using namespace std;
int main() {
random_device r;
std::vector<std::default_random_engine> generators;
for (int i = 0, N = omp_get_max_threads(); i < N; ++i) {
generators.emplace_back(default_random_engine(r()));
}
int N = 1000;
vector<int> v(N);
#pragma omp parallel for
for (int i = 0; i < N; ++i) {
// Get the generator based on thread id
default_random_engine& engine = generators[omp_get_thread_num()];
// Perform heavy calculations
uniform_int_distribution<int> uniform_dist(1, 100);
v[i] = uniform_dist(engine); // I assume this is thread unsafe
}
return 0;
}
请记住,此代码假定函数 omp_set_num_threads
永远不会在程序中被调用。如果发生这种情况,线程将有可能获得比旧 omp_get_max_threads()
更大的数字 (omp_get_thread_num()
),这会导致缓冲区溢出错误。
遗憾的是,此解决方案采用了标准