计算机视觉
Computer Vision
我是计算机视觉新手。我正在尝试从视频帧和图像中提取文本。 github 中提供的大部分代码都与 python <3 版本兼容。关于如何继续并获得相关代码和优秀论文的任何想法。
注意:我已经实现了pytesseract-OCR,但还没有得到好的结果。
From this image, I have to extract acer
你好 TISHANT CHANDRAKAR。
首先,您必须了解文本识别器的工作原理。
1. have-text-region is extracted from the image
2. we recognize text for each region
3. Combine the text of all regions to form final result
Tesseract 本身在第 2 步中运行良好。但对于第 1 步,它仅适用于文档中的文本。在计算机视觉中,步骤 1 称为 "Scene text detection"。所以你的下一步是找到一些好的代码,或者可以做到 "scene text detection".
的论文
如果您想学习和阅读论文,这里有一个列表 Scene text detection list。但在我看来,你图片中的文字是黑底白字,所以一个简单的颜色阈值可以轻松解决第 1 步。
希望有所帮助
有很多用于文本检测和识别的存储库,tesseract 不错,但您需要像识别 oem 一样正确配置它,psm 参数遵循下面的 link 以获得更多最佳实践
https://ai-facets.org/tesseract-ocr-best-practices/
在你的示例图像上,重要的是文本检测和预处理步骤,如去歪斜校正,你可以查看 OpenCV 示例
我是计算机视觉新手。我正在尝试从视频帧和图像中提取文本。 github 中提供的大部分代码都与 python <3 版本兼容。关于如何继续并获得相关代码和优秀论文的任何想法。
注意:我已经实现了pytesseract-OCR,但还没有得到好的结果。
From this image, I have to extract acer
你好 TISHANT CHANDRAKAR。
首先,您必须了解文本识别器的工作原理。
1. have-text-region is extracted from the image
2. we recognize text for each region
3. Combine the text of all regions to form final result
Tesseract 本身在第 2 步中运行良好。但对于第 1 步,它仅适用于文档中的文本。在计算机视觉中,步骤 1 称为 "Scene text detection"。所以你的下一步是找到一些好的代码,或者可以做到 "scene text detection".
的论文如果您想学习和阅读论文,这里有一个列表 Scene text detection list。但在我看来,你图片中的文字是黑底白字,所以一个简单的颜色阈值可以轻松解决第 1 步。
希望有所帮助
有很多用于文本检测和识别的存储库,tesseract 不错,但您需要像识别 oem 一样正确配置它,psm 参数遵循下面的 link 以获得更多最佳实践
https://ai-facets.org/tesseract-ocr-best-practices/
在你的示例图像上,重要的是文本检测和预处理步骤,如去歪斜校正,你可以查看 OpenCV 示例