AVX2 指令延迟和吞吐量
AVX2 instructions latency and throughput
我对以下 intrinsics/instructions 的性能属性感兴趣:
_mm256_andnot_si256
/ vpandn
_mm256_and_si256
/ vpand
_mm256_cmpgt_epi32
/ vpcmpgtd
- 和其他一些人。
但遗憾的是 Intel Intrinsics Guide 不包含那些 intrinsics/instructions 的延迟和吞吐量数字表。我在哪里可以找到这些信息?
延迟和吞吐量数字的三个来源是:
InstlatX64 列出了许多不同形式的指令(内存 and/or 寄存器操作数,不同的操作数宽度等),但没有关于每个执行端口的 μops 数量的信息。对于性能优化,不仅延迟和吞吐量数字很重要,而且每个执行端口的这些 μops 也非常相关。此信息由
Agner Fog 的指令表和 uops.info .
我对以下 intrinsics/instructions 的性能属性感兴趣:
_mm256_andnot_si256
/vpandn
_mm256_and_si256
/vpand
_mm256_cmpgt_epi32
/vpcmpgtd
- 和其他一些人。
但遗憾的是 Intel Intrinsics Guide 不包含那些 intrinsics/instructions 的延迟和吞吐量数字表。我在哪里可以找到这些信息?
延迟和吞吐量数字的三个来源是:
InstlatX64 列出了许多不同形式的指令(内存 and/or 寄存器操作数,不同的操作数宽度等),但没有关于每个执行端口的 μops 数量的信息。对于性能优化,不仅延迟和吞吐量数字很重要,而且每个执行端口的这些 μops 也非常相关。此信息由 Agner Fog 的指令表和 uops.info .