Tensorflow 不生成 GPU 跟踪信息
Tensorflow does not generate GPU tracing information
我开始了一个新的机器学习项目。
根据此文档 (https://www.tensorflow.org/tensorboard/tensorboard_profiling_keras)
带有 Tensorboard 的 TF 似乎支持 GPU 分析。因此,我在我的 Jupyter Notebook 中使用了相同的代码进行测试。
示例代码生成分析结果。但是,结果文件中没有 GPU 跟踪信息。 (仅 CPU)
这是我的主要问题。
我正在使用两张 RTX 2080 TI 显卡。
而且,他们在 运行 代码时工作。
示例代码没有使用MirroredStrategy。所以,我可以看到其中之一是 运行.
起初,我以为 Tensorboard 是问题所在。但是,我很快意识到 TF 不会生成 GPU 跟踪信息。
上图是生成的文件 (local.trace)。没有 GPU 数据。
这是我的系统规格。
- OS ubuntu 18.04
- jupyter-客户端 5.3.4
- jupyter-core 4.6.1
- jupyter-tensorboard 0.1.10
- tensorflow-GPU 2.0.0
- tensorflow-estimator 2.0.1
- 张量流元数据 0.15.1
- 张量板 2.0.2
- nVidia 410.104
- CUDA 10.0
- anaconda 4.7.12(python 3.6)
看起来无关紧要,但出现了如下图所示的警告消息。
我已经在其他电脑上测试过了,得到了同样的结果。可能是 GPU 分析仅支持 Google Colab。 (我还是一头雾水)最近在google上搜索了一下,解决了这个问题。我还是得不到答案。
是否有人在您自己的系统上使用 GPU 分析而不是 Google Colab?
请多多指教
我弄清楚是什么导致了这个问题。
与CUPTI(CUDA Profiling Tools Interface)相关
与 Jupyter Notebook 相比,在 Ubunto shell.
上当代码为 运行 时会出现警告消息
CUPTI error: CUPTI could not be loaded or symbol could not be found.
TF 找不到 CUPTI 库。这是问题的主要原因。
添加LD_LABRARY_PATH的路径如下link,问题解决!
我开始了一个新的机器学习项目。
根据此文档 (https://www.tensorflow.org/tensorboard/tensorboard_profiling_keras)
带有 Tensorboard 的 TF 似乎支持 GPU 分析。因此,我在我的 Jupyter Notebook 中使用了相同的代码进行测试。
示例代码生成分析结果。但是,结果文件中没有 GPU 跟踪信息。 (仅 CPU)
这是我的主要问题。
我正在使用两张 RTX 2080 TI 显卡。
而且,他们在 运行 代码时工作。
示例代码没有使用MirroredStrategy。所以,我可以看到其中之一是 运行.
起初,我以为 Tensorboard 是问题所在。但是,我很快意识到 TF 不会生成 GPU 跟踪信息。
上图是生成的文件 (local.trace)。没有 GPU 数据。
这是我的系统规格。
- OS ubuntu 18.04
- jupyter-客户端 5.3.4
- jupyter-core 4.6.1
- jupyter-tensorboard 0.1.10
- tensorflow-GPU 2.0.0
- tensorflow-estimator 2.0.1
- 张量流元数据 0.15.1
- 张量板 2.0.2
- nVidia 410.104
- CUDA 10.0
- anaconda 4.7.12(python 3.6)
看起来无关紧要,但出现了如下图所示的警告消息。
我已经在其他电脑上测试过了,得到了同样的结果。可能是 GPU 分析仅支持 Google Colab。 (我还是一头雾水)最近在google上搜索了一下,解决了这个问题。我还是得不到答案。
是否有人在您自己的系统上使用 GPU 分析而不是 Google Colab?
请多多指教
我弄清楚是什么导致了这个问题。
与CUPTI(CUDA Profiling Tools Interface)相关
与 Jupyter Notebook 相比,在 Ubunto shell.
上当代码为 运行 时会出现警告消息CUPTI error: CUPTI could not be loaded or symbol could not be found.
TF 找不到 CUPTI 库。这是问题的主要原因。
添加LD_LABRARY_PATH的路径如下link,问题解决!