Intel MIC - 内在向量元素的总和
Intel MIC - sum of intrinsic vector elements
我有一个 __m512d 内在向量,我需要他的元素之和。有什么简单的方法可以做到这一点?我专注于计算性能,所以我需要快速执行此操作。我对内在的了解不足以自己做,所以我需要你的帮助。
谢谢:)
我想以下内在函数应该对您有所帮助:
double _mm512_reduce_add_pd (__m512d a)
P.S。您可以自己在 the guide 中寻找有用的内在函数。
我有一个 __m512d 内在向量,我需要他的元素之和。有什么简单的方法可以做到这一点?我专注于计算性能,所以我需要快速执行此操作。我对内在的了解不足以自己做,所以我需要你的帮助。
谢谢:)
我想以下内在函数应该对您有所帮助:
double _mm512_reduce_add_pd (__m512d a)
P.S。您可以自己在 the guide 中寻找有用的内在函数。