我们可以使用 Yolo 来检测和识别图像中的文本吗

Can we use Yolo to detect and recognize text in a image

目前我正在使用一个叫做"Yolov2"的深度学习模型来进行对象检测,我想用它来提取文本并将其保存在磁盘中,但我不知道该怎么做那个,如果有人知道更多,请告诉我

我使用 Tensorflow

谢谢

如果您使用预训练模型,则需要保存这些输出并将图像输入字符识别网络(如果使用神经网络或其他方法)。

你正在做的是"scene text recognition"。您可以查看 Reading Text in the Wild with Convolutional Neural Networks paper, here's a demo and homepage. Github user chongyangtao has a whole list 有关该主题的资源。

我有一个类似的问题,我正在用 svhn 数据集制作一个数字检测模型。这还不是一个完成的项目,但它似乎运作良好。您可以在 Yolo-digit-detector.

查看代码