TensorFlow：收集我自己的训练数据集并使用该训练数据集查找对象的位置

TensorFlow: Collecting my own training data set & Using that training dataset to find the location of object

我正在尝试收集我自己的图像检测（识别）训练数据集。现在，我有 4 类和 750 张图片。每个图像只是每个类的常规图像；但是，某些图像模糊或包含外部对象，例如不同的背景或其他因素（但没有可区分的东西）。使用那个训练数据集，图像识别真的很糟糕。

我的问题是， 1.训练图像集是否需要包含各种background/setting/environment中的对象（我相信不是...）？ 2. 假设训练相当准确，我想知道物体在图像上的位置。我想我无法通过图像识别找到位置，所以如果我使用边界框，代码中的 how/where 我可以看到边界框的位置吗？

提前致谢！

很难提前知道您的程序将为每个 class 学习哪些功能。但话又说回来，如果你看不见的图像将在同一背景中，背景将不起作用。我建议在培训中增加数据；随机颜色失真，随机翻转，随机裁剪。

您在代码中看不到边界框的位置。你必须首先在你收集的数据中 label/annotate 他们自己，例如使用 LabelMe 这样的工具。然后是学习对象检测器。