A53 的指令执行延迟

Instruction execution latencies for A53

我正在优化一个使用浮点指令的函数。

对于基准测试,我需要知道指令的执行延迟才能了解理论上可能的性能。

我找到了A57的说明书:http://infocenter.arm.com/help/topic/com.arm.doc.uan0015b/Cortex_A57_Software_Optimization_Guide_external.pdf

但是,我没有找到 A53 的此类文档。 我错过了什么吗? A53有没有这样的优化指南?

某位圣人独立测量了指令延迟。

http://hardwarebug.org/2014/05/15/cortex-a7-instruction-cycle-timings/

请注意,a53 从 a7 演变而来,因此时间可能相似。它与 a57 的设计完全不同,后者具有更长的流水线和乱序执行。

不幸的是,据我所知,关于 Cortex A53 周期计时的信息非常少。至关重要的是,根据我的测量,NEON 延迟与 Cortex A7 上发生的延迟有很大不同。

written microbenchmarking software to figure out what's going on with regards to the instruction cycle timings. There are some tables in the paper that was related to this work (also on IACR eprint).