NotFoundError : ; on tensorflow 1.5 object detection API, running smoothly on 1.4

NotFoundError : ; on tensorflow 1.5 object detection API, running smoothly on 1.4

我最近将我的一个小型 ubuntu (16.04) 服务器从 tensorflow-gpu 1.4 升级到 tensorflow-gpu 1.5 以处理对象检测 API。我已经 git 克隆了应该与 tensorflow 1.5 一起使用的最新版本 API。

CUDA/cudNN 和其他 tensorflow 程序在升级后 运行ning 正常运行,对象检测 API 中的所有测试脚本都 运行ning 正常。

尽管如此,当我尝试 运行 train.py 时,它立即失败并出现以下错误:

File "/home/arvid/ownCloud/tensorflow/models/research/object_detection/train.py", line 167, in <module> tf.app.run()
File "/usr/local/lib/python3.5/dist-packages/tensorflow/python/platform/app.py", line 124, in run _sys.exit(main(argv))
File "/home/arvid/ownCloud/tensorflow/models/research/object_detection/train.py", line 107, in main overwrite=True)
File "/usr/local/lib/python3.5/dist-packages/tensorflow/python/lib/io/file_io.py", line 385, in copy compat.as_bytes(oldpath), compat.as_bytes(newpath), overwrite, status)
File "/usr/local/lib/python3.5/dist-packages/tensorflow/python/framework/errors_impl.py", line 473, in __exit__ c_api.TF_GetCode(self.status.status)) 

tensorflow.python.framework.errors_impl.NotFoundError: ; No such file or directory

当输入文件丢失时出现此错误,但这里的问题是错误中没有指定文件。

通常丢失的文件出现在逗号和分号之间,但在这个错误中它只是一个空白space。

我可以在我的工作服务器 运行ning tensorflow 1.4 上重现相同的错误,方法是在 --train_dir= 和路径之间插入 space:

--train_dir= {some_path}

但这里不是这样的!

附加信息:当我 运行 train.py 在我指定的位置创建 'train' 目录时,所以 tensorflow 似乎能够识别路径等..

任何关于如何调试的输入将不胜感激!!

(好吧,我现在感觉有点傻...)

解决方案很简单 - train.py 的标志名称随更新而改变...

以前是:

--pipeline_config={some_path}

但现在是:

--pipeline_config_path={some_path}

不过,如果有信息更丰富的错误消息,它会很有用...

去掉--train_dir= {some_path}--pipeline_config_path= {some_path}之间的一些空格.

对我有用。