Tensorflow 初始再训练:瓶颈文件创建

Tensorflow inception retraining : bottleneck files creation

我正在按照 the tutorial 重新训练适合我自己问题的初始模型。 我在大约 100 个文件夹/类别中有大约 50 000 张图像。

运行 这个

bazel build tensorflow/examples/image_retraining:retrain

bazel-bin/tensorflow/examples/image_retraining/retrain --image_dir /path/to/root_folder_name

在 Amazon EC2 g2.2xlarge 上我希望整个过程会非常快(比在我的笔记本电脑上快)但是瓶颈文件创建需要很长时间。 假设已经过了 2 个小时,并且只创建了 800 个文件,我将需要超过 5 天 (!!) 来创建文件...

由于 GPU 的缘故,它是否应该比这个节奏更快(约 400 个瓶颈文件/小时)?

我怎样才能使这个过程更快?

终于找到了问题的答案。

Bazel 在没有 GPU 支持的情况下工作。为了解决这个问题,我修改了有关这些问题的文件:

和运行

TF_UNOFFICIAL_SETTING=1 ./configure

bazel build -c opt --config=cuda tensorflow/examples/image_retraining:retrain --verbose_failures

bazel-bin/tensorflow/examples/image_retraining/retrain --image_dir ~/Images/

最终,这个过程快了很多(500 张图片/秒),而且训练本身也是用 GPU 完成的!