我可以在 GPU 上进行这种并行计算吗?

Can I do this kind of parallel computing on GPU?

我有一个 M*N 整数矩阵,我需要遍历它并为每个元素计算它 M[i][j]:

The integer which appears most often in the submatrix from (i-k,j-k) to (i+k, j+k).

所以结果是一个矩阵,每个单元格都是原始矩阵中 [i,j] 周围的主导数字。

矩阵可能很大,我需要在一个紧凑的循环中做这个运算,所以我想通过并行计算来最小化运算时间。

我知道 GPU 擅长矩阵乘法,但看起来这不能简化为简单的矩阵乘法。 (或者可以吗?)

是否可以在 GPU 上并行计算每个单元格?如果是,我想在 iOS 中实现它,我应该使用什么编程接口,Metal? OpenGL?

是的,您可以在 GPU 上进行此计算。

Metal 似乎用于图形和通用计算。所以你应该可以根据需要使用它(这里有一篇介绍它的文章:http://memkite.com/blog/2014/12/15/data-parallel-programming-with-metal-and-swift-for-iphoneipad-gpu/

Accelerate也能满足我们的需求

希望对您有所帮助。