仅检测检测到的对象内的文本

Detect text only inside detected objects

我对计算机视觉还很陌生,我正在尝试构建一个 CV 模型,它将检测和识别价格标签并从中提取信息。我已经训练了可以使用 YOLO 检测价格标签的模型。但我也想教我的系统检测和识别只写在这些价格标签内的文本。将此信息解析为不同的部分,例如:价格、产品名称、产品描述。或者我可能首先需要解析检测到的块(价格标签左侧的价格块,右侧的产品名称等)然后读取它。任何想法都会得到应用。

嗯,我第一个想到的是裁剪使用 YOLO 检测到的对象,然后 运行 该图像上的 OCR。在 运行ning OCR 之后,您必须进行一些后处理以将每行文本分类到特定类别(价格、名称等)