如何使用可视化分析器识别我的 CUDA 代码的带宽和失败率?

How can I identify the bandwidth and flop rate of my CUDA code using visual profiler?


在执行我的一个 cuda 实现后,我附上了可视化分析器的屏幕截图。 我只想使用可视化分析器 找出带宽和我的实现的失败率。希望我在图中提到的字段显示我的 GPU 的最大可能带宽和翻转率。
提前致谢。

我找到了答案。您需要按照以下步骤找到翻牌率。

  1. 打开Metrics and Events window(shift + ctrl + E),在附图中标记说明。
  2. 然后申请 运行。
  3. 执行完成后,可以在step2图的下方看到flops的计数。
  4. 现在你已经数出了不同的失败。但是,您必须通过找出受尊重的执行时间来计算失败率。