已经设置了CUDA_PROFILE=1 和COMPUTE_PROFILE=1,但是没有日志文件输出?
Already set CUDA_PROFILE=1 and COMPUTE_PROFILE=1, but no log file output?
系统上安装了两张 A100 卡。尝试使用 CUDA Cmd-Line 分析器。 运行 CUDA最简单的例子。输入命令
export COMPUTE_PROFILE=1
export CUDA_PROFILE=1
./simpleMultiGPU
输出
Starting simpleMultiGPU
CUDA-capable device count: 2
Generating input data...
Computing with 2 GPUs...
GPU Processing time: 7.483000 (ms)
Computing with Host CPU...
Comparing GPU and Host CPU results...
GPU sum: 16777280.000000
CPU sum: 16777294.395033
Relative difference: 8.580068E-07
但是没有日志文件输出。类型
ls -a
仍然输出
. .. Makefile NsightEclipse.xml readme.txt simpleMultiGPU simpleMultiGPU.cu simpleMultiGPU.h simpleMultiGPU.o
可能是什么原因?提前致谢!
您尝试使用的命令行分析器不属于任何支持 GPU(如 A100)的 CUDA 工具包。它在前一段时间被弃用和删除(它在 CUDA 8.0 之前被删除。CUDA 11.x 或更高版本需要 A100 支持)。
推荐的分析器是 nsight compute 和 nsight systems。一组介绍性博客开始 here.
系统上安装了两张 A100 卡。尝试使用 CUDA Cmd-Line 分析器。 运行 CUDA最简单的例子。输入命令
export COMPUTE_PROFILE=1
export CUDA_PROFILE=1
./simpleMultiGPU
输出
Starting simpleMultiGPU
CUDA-capable device count: 2
Generating input data...
Computing with 2 GPUs...
GPU Processing time: 7.483000 (ms)
Computing with Host CPU...
Comparing GPU and Host CPU results...
GPU sum: 16777280.000000
CPU sum: 16777294.395033
Relative difference: 8.580068E-07
但是没有日志文件输出。类型
ls -a
仍然输出
. .. Makefile NsightEclipse.xml readme.txt simpleMultiGPU simpleMultiGPU.cu simpleMultiGPU.h simpleMultiGPU.o
可能是什么原因?提前致谢!
您尝试使用的命令行分析器不属于任何支持 GPU(如 A100)的 CUDA 工具包。它在前一段时间被弃用和删除(它在 CUDA 8.0 之前被删除。CUDA 11.x 或更高版本需要 A100 支持)。
推荐的分析器是 nsight compute 和 nsight systems。一组介绍性博客开始 here.