如何使用 OpenMP 以线程安全的方式生成随机数

Question

在并行化之前，我在循环外创建了一个 default_random_engine 对象，因为创建这样的对象并不便宜。我在循环中重复使用它。

在与 OpenMP 并行化时，我注意到 uniform_dist(engine) 对随机引擎进行了可变引用，我认为这不是线程安全的。程序没有崩溃，但我担心它的正确性。

我假设 random_device 是线程安全的，所以我可以将 default_random_engine 的定义移动到循环中，但我不想每次迭代都创建一个随机引擎对象，因为我读到了那可不便宜。

我认为另一种方法是创建一个 default_random_engine 对象的数组（大小：线程数）并使用 OpenMP 函数 select 开头的正确对象每次迭代基于线程 ID。

有没有更好的方法？

#include <iostream>
#include <random>
using namespace std;

int main() {
    int N = 1000;
    vector<int> v(N);
    random_device r;
    default_random_engine engine(r());

    #pragma omp parallel for
    for (int i = 0; i < N; ++i) {
         uniform_int_distribution<int> uniform_dist(1, 100);
         // Perform heavy calculations
         v[i] = uniform_dist(engine); // I assume this is thread unsafe
    }
    return 0;
}

Answer 1

由于实际代码将随机引擎传递给许多函数（每个函数都从不同的分布生成整数和实数），我选择了每个线程的生成器数组，因为它对代码库的改动最少：

#include <iostream>
#include <omp.h>
#include <vector>
#include <random>
using namespace std;

int main() {
    random_device r;
    std::vector<std::default_random_engine> generators;
    for (int i = 0, N = omp_get_max_threads(); i < N; ++i) {
        generators.emplace_back(default_random_engine(r()));
    }

    int N = 1000;
    vector<int> v(N);

    #pragma omp parallel for
    for (int i = 0; i < N; ++i) {
        // Get the generator based on thread id
        default_random_engine& engine = generators[omp_get_thread_num()];
        // Perform heavy calculations
        uniform_int_distribution<int> uniform_dist(1, 100);
        v[i] = uniform_dist(engine); // I assume this is thread unsafe
    }
    return 0;
}

请记住，此代码假定函数 omp_set_num_threads 永远不会在程序中被调用。如果发生这种情况，线程将有可能获得比旧 omp_get_max_threads() 更大的数字 (omp_get_thread_num())，这会导致缓冲区溢出错误。

遗憾的是，此解决方案采用了标准不需要的实施细节。

如何使用 OpenMP 以线程安全的方式生成随机数

How to generate random numbers in a thread safe way with OpenMP

c++

random

multithreading

openmp