Android OCR 项目

Android OCR project

我正在使用 OCR android 应用程序。 现在我可以使用 google 视觉 API 轻松拍摄图像和提取单词 但根据拍摄图像的角度,结果不是100%。 和 照明。 所以我尝试在提取文本之前对图像进行一些图像处理技术。但我搜索了很多,但我无法确定最好的图像处理技术是什么。(模糊,过滤) 来平滑图像并提高其质量。 所以如果有任何图书馆或指南可以跟进这个主题。 如何在提取文本之前提高图像质量

我测试了这个库的 OCR 操作

Tesseract

Google Mobile Vision APIs

没有您的示例图像,很难准确地说出哪些图像处理函数可以帮助您。根据拍摄图像的环境,每张图像都可能以自己的方式有所不同,因此没有一定数量的图像处理功能可用于所有图像。如果您尝试过 Tesseract,他们会提供 post on Github 解释改进图像以获得更好识别结果的最佳方法。我真的不能给你任何具体的图像处理函数来帮助你 link 因为我不知道你的图像到底是什么样子的。

提高识别结果的另一种方法是训练 OCR 引擎本身,使其能够更好地识别图像中的文本。 Tesseract 也让您能够做到这一点:

https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00