高效实现矩阵乘法ARM cortex A9 - Xilinx SDK

Efficient implementation of matrix multiplication ARM cortex A9 - Xilinx SDK

是否有任何简单的方法库可以使用 Xilinx SDK 在 ARM CortexA9 双核上高效（最大可能速度）实现线性代数？

我正在使用带有双核 Arm 处理器的 zybo z7 developememt 板，我想在 Xilinx SDK 上实现一个简单的神经网络，其中一个卷积层后跟一个密集层。具体来说，要在 Arm 上传输基于 python numpy 的模型。我阅读了一些 ARM 和 SIMD 库的手册，但我不想深入研究。

对我来说一个简单的方法是使用一个库并像 python 中的 numpy 一样（快速）自己执行 multiplication/dot product/convolve 等并避免纯 for... 循环句法。举个例子就好了！

感谢您的宝贵时间

您可以尝试Eigen library used by Tensorflow to implement the matrix calculations, or you can even try to use TensorFlow lite，它已经在 ARM-Cortex M 系列处理器上进行了测试。

高效实现矩阵乘法ARM cortex A9 - Xilinx SDK

Efficient implementation of matrix multiplication ARM cortex A9 - Xilinx SDK

c

arm

linear-algebra

xilinx

zynq