有什么方法可以报告/分享 Numba prange 循环的结果吗?
Is there any way at all to report / share results from a Numba prange loop?
我有一个大的 prange 循环,可以在这里高效地执行一些过程。我想跟踪其中一个何时找到更好的结果。但是,在 prange 循环中写入变量似乎会创建一个新的私有变量,因此无法以这种方式共享数据。
这是一个典型的例子:这个 prange 在多个数组中搜索最大的随机值。我希望他们“合作”,以便只打印新的最高值:
import numpy as np
from numba import jit, prange
@jit(nopython=True, parallel=True)
def test():
arr = np.random.rand(1000, 15000000)
largest_value = 0
for i in prange(arr.shape[0]):
for val in arr[i]:
if val > largest_value:
print('NEW LARGEST VALUE: ' + str(int(largest_value * 100000000)))
largest_value = val
test()
运行 这将打印虚假值,例如:
...
NEW LARGEST VALUE: 85809181
NEW LARGEST VALUE: 93504938
NEW LARGEST VALUE: 75796671
NEW LARGEST VALUE: 83944676
NEW LARGEST VALUE: 99068766
这是因为每个线程在写入 largest_value
时都会创建一个本地私有副本,因此他们无法以这种方式分享他们的发现。
有没有什么技巧可以做到这一点?共享内存?有什么我想念的吗?还有别的吗?
线程之间共享数据的解决方案是在并行循环之前创建一个数组,以便线程可以在并行循环中填充共享数组。请注意,在写入共享数组时应注意 false-sharing(出于性能考虑)。
在某些情况下,您只需要编写每线程信息。在这种情况下,您可以分配一个大小为 get_num_threads()
的数组(可能更大以防止错误共享)并在 get_thread_id()
提供的位置写入。这些函数应该由 Numba 在并行循环中提供。您可以在 documentation.
中找到更多相关信息
请注意,old/manual 方法是使用额外的包含循环 for threadId in prange(get_num_threads())
并使用 threadId
作为共享数组的索引。因此,迭代 space 必须手动划分,以便在线程之间平均分担工作(这做起来有点麻烦)。幸运的是,应该不再需要这个解决方案了(至少在最简单的情况下)。
我有一个大的 prange 循环,可以在这里高效地执行一些过程。我想跟踪其中一个何时找到更好的结果。但是,在 prange 循环中写入变量似乎会创建一个新的私有变量,因此无法以这种方式共享数据。
这是一个典型的例子:这个 prange 在多个数组中搜索最大的随机值。我希望他们“合作”,以便只打印新的最高值:
import numpy as np
from numba import jit, prange
@jit(nopython=True, parallel=True)
def test():
arr = np.random.rand(1000, 15000000)
largest_value = 0
for i in prange(arr.shape[0]):
for val in arr[i]:
if val > largest_value:
print('NEW LARGEST VALUE: ' + str(int(largest_value * 100000000)))
largest_value = val
test()
运行 这将打印虚假值,例如:
...
NEW LARGEST VALUE: 85809181
NEW LARGEST VALUE: 93504938
NEW LARGEST VALUE: 75796671
NEW LARGEST VALUE: 83944676
NEW LARGEST VALUE: 99068766
这是因为每个线程在写入 largest_value
时都会创建一个本地私有副本,因此他们无法以这种方式分享他们的发现。
有没有什么技巧可以做到这一点?共享内存?有什么我想念的吗?还有别的吗?
线程之间共享数据的解决方案是在并行循环之前创建一个数组,以便线程可以在并行循环中填充共享数组。请注意,在写入共享数组时应注意 false-sharing(出于性能考虑)。
在某些情况下,您只需要编写每线程信息。在这种情况下,您可以分配一个大小为 get_num_threads()
的数组(可能更大以防止错误共享)并在 get_thread_id()
提供的位置写入。这些函数应该由 Numba 在并行循环中提供。您可以在 documentation.
请注意,old/manual 方法是使用额外的包含循环 for threadId in prange(get_num_threads())
并使用 threadId
作为共享数组的索引。因此,迭代 space 必须手动划分,以便在线程之间平均分担工作(这做起来有点麻烦)。幸运的是,应该不再需要这个解决方案了(至少在最简单的情况下)。