对象检测速度慢且不使用 GPU

Object detection slow and does not use GPU

我需要使用 Tensorflow Object Detection API 进行一些与识别相关的分类。

我的问题是,使用 API 对预训练的 coco 模型进行检测需要太多时间,而且肯定不会使用 GPU。我在不同的脚本上检查了我的 tensorflow-gpu 安装,它工作正常,但是当我使用这个模型进行检测时,我只能看到 CPU 使用量增加。

我检查了不同版本的tensorflow(1.12、1.14)、CUDA Toolkit(9.0、10.0)和CuDNN(7.4.2、7.5.1、7.6.1)的不同组合,但都是一样的,也在 Windows 7 和 Ubuntu 16.04 上都试过了,没有区别。然而,我的项目需要更快的检测时间。

系统信息: 系统:Windows7,Ubuntu16.04 张量流:1.12、1.14 显卡:GTX 970

运行下面的python代码,如果它检测到GPU,那么你可以使用GPU进行训练,否则会有一些问题,

from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())

还有一件事,仅仅因为您的 CPU 正在使用并不意味着 GPU 不工作。 CPU 总是很忙,训练的时候GPU也要秒杀。

如果您不确定输出结果,请将以上代码的输出粘贴到评论中。

编辑:在评论中与 OP 聊天后,我看到了建议的代码,它使用的是预训练模型,所以这里没有进行训练。您正在 使用 模型,而不是训练新模型。所以没有使用 gpu。