有什么方法可以报告/分享 Numba prange 循环的结果吗?

Is there any way at all to report / share results from a Numba prange loop?

我有一个大的 prange 循环,可以在这里高效地执行一些过程。我想跟踪其中一个何时找到更好的结果。但是,在 prange 循环中写入变量似乎会创建一个新的私有变量,因此无法以这种方式共享数据。

这是一个典型的例子:这个 prange 在多个数组中搜索最大的随机值。我希望他们“合作”,以便只打印新的最高值:

import numpy as np
from numba import jit, prange

@jit(nopython=True, parallel=True)
def test():
    arr = np.random.rand(1000, 15000000)

    largest_value = 0
    for i in prange(arr.shape[0]):
        for val in arr[i]:
            if val > largest_value:
                print('NEW LARGEST VALUE: ' + str(int(largest_value * 100000000)))
                largest_value = val

test()

运行 这将打印虚假值,例如:

...
NEW LARGEST VALUE: 85809181
NEW LARGEST VALUE: 93504938
NEW LARGEST VALUE: 75796671
NEW LARGEST VALUE: 83944676
NEW LARGEST VALUE: 99068766

这是因为每个线程在写入 largest_value 时都会创建一个本地私有副本,因此他们无法以这种方式分享他们的发现。

有没有什么技巧可以做到这一点?共享内存?有什么我想念的吗?还有别的吗?

线程之间共享数据的解决方案是在并行循环之前创建一个数组,以便线程可以在并行循环中填充共享数组。请注意,在写入共享数组时应注意 false-sharing(出于性能考虑)。

在某些情况下,您只需要编写每线程信息。在这种情况下,您可以分配一个大小为 get_num_threads() 的数组(可能更大以防止错误共享)并在 get_thread_id() 提供的位置写入。这些函数应该由 Numba 在并行循环中提供。您可以在 documentation.

中找到更多相关信息

请注意,old/manual 方法是使用额外的包含循环 for threadId in prange(get_num_threads()) 并使用 threadId 作为共享数组的索引。因此,迭代 space 必须手动划分,以便在线程之间平均分担工作(这做起来有点麻烦)。幸运的是,应该不再需要这个解决方案了(至少在最简单的情况下)。