预测指标出乎意料地高
predicated-on metric unexpectedly high
我正在分析内核(nsight 2021.2.1,计算能力 8.3,cuda 11.4)并查看为源代码行执行的指标 Avg 线程。据我了解,该值可以在 0 到 32 之间。但是,在我的分析中,它要高得多。
很明显,我对预测指令指标的理解很差,因此对平均线程执行方式的理解也很差。我应该如何解释这个值,我可以从中得出任何结论吗?
这是源代码视图中的错误。源代码视图列从汇编指令汇总到源代码行。这适用于执行的指令和执行的预测线程指令,但不适用于平均。线程已执行。
正确的值为
Predicated-On Thread Instructions Executed / Instructions Executed = Avg Thread Executed
91,714,560,000 / 2,866,080,000 = 32
如果您单击“源代码行”并在 SASS 视图中查看相关的汇编代码,您可能会找到 7 条指令。
224 / 32 = 7.
我正在分析内核(nsight 2021.2.1,计算能力 8.3,cuda 11.4)并查看为源代码行执行的指标 Avg 线程。据我了解,该值可以在 0 到 32 之间。但是,在我的分析中,它要高得多。
很明显,我对预测指令指标的理解很差,因此对平均线程执行方式的理解也很差。我应该如何解释这个值,我可以从中得出任何结论吗?
这是源代码视图中的错误。源代码视图列从汇编指令汇总到源代码行。这适用于执行的指令和执行的预测线程指令,但不适用于平均。线程已执行。
正确的值为
Predicated-On Thread Instructions Executed / Instructions Executed = Avg Thread Executed
91,714,560,000 / 2,866,080,000 = 32
如果您单击“源代码行”并在 SASS 视图中查看相关的汇编代码,您可能会找到 7 条指令。
224 / 32 = 7.