赛车图像标注

Racecar image tagging

我正在开发一个系统来简化我们的图片库,该图片库每周增加 7 千到 2 万张新图片。具体应用是识别图片中有哪些赛车(所有的车都是相似的形状,不同的油漆方案)。我计划在项目的这一部分使用 python 和 tensorflow。

我最初的想法是用图像分类来对汽车图像进行分类;但是,图片中包含多辆汽车的可能性非常大。我的下一个想法是使用 object 检测来检测车号(出现在所有汽车的固定位置 [鼻子、尾巴、两扇门和车顶] 并且每周都保持一致的字体)。最后是object整车识别的方法。从表面上看,这似乎是最实用的;但是,油漆方案变化很大,可能不会。

哪种方法会给我最好的结果?我已经拉出了大量图像进行训练,显然不同的方法需要非常不同的训练数据集。

最好的方法是将所有 3 种方法作为整体使用。您训练所有 3 个模型,并将输入图像传递给所有 3 个模型。然后,有几种方法可以评估输出。

  1. 您可以将所有 3 个模型的所有 类 的概率相加,然后根据最高概率得出结论。

  2. 您可以从每个模型中获得预测并根据投票数决定:1.模型 - class1,2.模型 - class2,3.模型 - class2 ==> class2

  3. 你可以做一些类似加权决策的事情。因此,假设第一个模型是最好的和最强大的模型,但您不是 100% 信任它并且想看看其他模型会怎么说。比起您可以将第一个模型的输出加权为 0.6,将其他两个模型的输出加权为 0.2。

希望对您有所帮助:)