是否有 GNU ARM NEON 内在函数的 C 实现?

Is there a C implementation for GNU ARM NEON intrinsics?

我不是在寻找可移植的 SIMD 实现。

我所需要的只是:一个精确到位的实现。只要不是非常慢,性能就不是很重要。

我想将它用于早期开发和测试,以便我可以在主机上编译和 运行 前 10 次以上的迭代。然后在 ARM 目标上交叉编译和微调性能。

当我像 described here 这样使用 TI DSP 时,我已经非常习惯这种开发周期。我想在迁移到 ARM NEON 时继续使用它。

这已经完成了吗,还是我需要发明轮子?

英特尔有 a useful set of macros, neon2sse.h 将 NEON 内在函数转换为 SSE。这使您能够在 x86 平台上使用 NEON 内在函数构建和测试 C/C++ 代码。