TensorFlow:收集我自己的训练数据集并使用该训练数据集查找对象的位置

TensorFlow: Collecting my own training data set & Using that training dataset to find the location of object

我正在尝试收集我自己的图像检测(识别)训练数据集。现在,我有 4 类 和 750 张图片。每个图像只是每个 类 的常规图像;但是,某些图像模糊或包含外部对象,例如不同的背景或其他因素(但没有可区分的东西)。使用那个训练数据集,图像识别真的很糟糕。

我的问题是, 1.训练图像集是否需要包含各种background/setting/environment中的对象(我相信不是...)? 2. 假设训练相当准确,我想知道物体在图像上的位置。我想我无法通过图像识别找到位置,所以如果我使用边界框,代码中的 how/where 我可以看到边界框的位置吗?

提前致谢!

很难提前知道您的程序将为每个 class 学习哪些功能。但话又说回来,如果你看不见的图像将在同一背景中,背景将不起作用。我建议在培训中增加数据;随机颜色失真,随机翻转,随机裁剪。

您在代码中看不到边界框的位置。你必须首先在你收集的数据中 label/annotate 他们自己,例如使用 LabelMe 这样的工具。然后是学习对象检测器。