Intel MIC - 内在向量元素的总和

Intel MIC - sum of intrinsic vector elements

我有一个 __m512d 内在向量,我需要他的元素之和。有什么简单的方法可以做到这一点?我专注于计算性能,所以我需要快速执行此操作。我对内在的了解不足以自己做,所以我需要你的帮助。

谢谢:)

我想以下内在函数应该对您有所帮助:

double _mm512_reduce_add_pd (__m512d a)

P.S。您可以自己在 the guide 中寻找有用的内在函数。