使用 ncu 分析统一内存中的页面错误

Using ncu to profile pagefault in unified memory

是否有任何选项可以使用 Nsight Compute (NCU) 分析统一虚拟内存 CUDA 应用程序?例如,我想知道处理页面错误和迁移所花费的时间。

最后,我自己想出了解决办法。只需指定 --export=json 即可将分析结果输出到 json 文件中,以获得页面错误的详细指标。 整体分析命令如下所示。

nsys profile \
     --force-overwrite=true \
     --cuda-um-gpu-page-faults=true \
     --cuda-um-cpu-page-faults=true \
     --export=json \
     ./yourapplication