event/metric 摘要模式 nvprof 中未显示分析结果
Profiling Result doesn't appear in event/metric summary mode nvprof
根据 documentation for event/summary 模式 nvprof
,输出如下:
==6461== Profiling application: matrixMul
==6461== Profiling result:
==6461== Event result:
//The outputs
==6461== Metric result:
//The outputs
default 应显示 API 调用和 Profiling result
下的内核的延迟、百分比等。所以有两个问题:
- 为什么
Profiling Result
下没有任何输出?
- 如何让
nvprof
也输出 Profiling Result
?
Why isn't any ouput under Profiling Result?
根据 documentation,它指出:
nvprof
operates in one of the modes listed below.
这些模式是:
- 3.1.1 摘要模式(默认)
- 3.1.2 GPU-Trace and/or API-Trace 模式
- 3.1.3 Event/metric 汇总模式
- 3.1.4 Event/metric 跟踪模式
您的摘录信息来自 3.1.3 Event/metric 摘要模式 。当您处于此模式时,您不处于任何其他模式,并且其他模式的数据收集(和输出)描述不适用。
How do I get nvprof
to output Profiling Result
also?
如果您想在每个内核的基础上捕获指标信息,请使用 3.1.4 Event/metric 跟踪模式。然后输出将出现在 Profiling Result
部分。
对于其他组合,不可能 nvprof
在单个 运行 中显示任意一组分析数据。如果您需要仅在特定模式下可用的输出,则需要在该模式下 运行 才能获得该输出。您可能需要多次 运行 nvprof
才能获取您想要收集的所有输出信息或数据。 nvvp
(可视化分析器)执行此操作(即会 运行 nvprof
多次,在引擎盖下)以便为给定的应用程序视图显示更大范围的数据。
根据 documentation for event/summary 模式 nvprof
,输出如下:
==6461== Profiling application: matrixMul
==6461== Profiling result:
==6461== Event result:
//The outputs
==6461== Metric result:
//The outputs
default 应显示 API 调用和 Profiling result
下的内核的延迟、百分比等。所以有两个问题:
- 为什么
Profiling Result
下没有任何输出? - 如何让
nvprof
也输出Profiling Result
?
Why isn't any ouput under Profiling Result?
根据 documentation,它指出:
nvprof
operates in one of the modes listed below.
这些模式是:
- 3.1.1 摘要模式(默认)
- 3.1.2 GPU-Trace and/or API-Trace 模式
- 3.1.3 Event/metric 汇总模式
- 3.1.4 Event/metric 跟踪模式
您的摘录信息来自 3.1.3 Event/metric 摘要模式 。当您处于此模式时,您不处于任何其他模式,并且其他模式的数据收集(和输出)描述不适用。
How do I get
nvprof
to outputProfiling Result
also?
如果您想在每个内核的基础上捕获指标信息,请使用 3.1.4 Event/metric 跟踪模式。然后输出将出现在 Profiling Result
部分。
对于其他组合,不可能 nvprof
在单个 运行 中显示任意一组分析数据。如果您需要仅在特定模式下可用的输出,则需要在该模式下 运行 才能获得该输出。您可能需要多次 运行 nvprof
才能获取您想要收集的所有输出信息或数据。 nvvp
(可视化分析器)执行此操作(即会 运行 nvprof
多次,在引擎盖下)以便为给定的应用程序视图显示更大范围的数据。