根据箭头标记识别汽车零件

Identify Parts of the car based on arrow markings

Please excuse me for not posting any code, as I don't think I have reached far enough to be relevant for my question.

我正在研究一种解决方案,需要识别客户图纸所指向的车辆部件并提取文本及其引用的部件,如下例所示。

我对 ML 或 AI 技术真的很陌生,因为我一直在考虑使用 Azure customvision.ai,它允许我使用一堆训练模型图像和对象识别,并且有一个很好的 REST API 可以使用。这有点管用,因为我能够传递图像,并且能够识别该图像上可见的汽车部分。

但是我无法理解如何识别 9. BXCU12 实际上指向 Bonnet

有人可以通过指出任何示例或合适的解决方法来帮助我解决这个问题。

如果我没理解错的话,你已经可以从你的识别网络和文本中识别出部分,它们之间的 link 是由你不知道如何定位的图像中的箭头给出的。因此,这里剩下的问题是检测箭头及其 end-points.

我现在可以想到两个解决方案:

1) 使用模板匹配来识别你的箭头。你的问题虽然(从你的示例图像)似乎是你的箭头具有相同的比例但具有不同的长度。所以,我建议只使用箭头的头部 + 很短的尾巴作为模板。然后你可以把这个小模板旋转N次,得到N个模板,用什么opencv provides in term of template matching.

2) 训练一个小型卷积神经网络来识别箭头。您只想识别箭头,因此创建一个包含不同比例的旋转箭头的小型数据集并在其上训练网络是相当容易的。请注意,您应该能够将此网络作为一个额外的、非常浅的头部添加到您的识别网络中(尽管您需要联合改进),因此开销会很小。

希望对您有所帮助。