android 中的离线图像到文本识别 (OCR)

Offline Image To Text Recognition (OCR) in android

如何构建用于图像到文本识别的 android 本机 SDK。 (我已经很好地使用了来自 Web 服务的一些 API。但是这一次,我只想制作没有任何 Internet 连接、没有 API 和 Web 服务的应用程序。只是一个 offline OCR应用程序)。 所以我的问题是

  1. 如何裁剪 图像中包含的每个单词?
  2. 如何比较 裁剪后的文本与字母和字符?

我猜你可以使用 Tesseract OCR Tool,Google 的开源替代品。如何通过 Tesseract Android 工具将其集成到 Android 中很简单 看看 tess-two project on github,它非常易于使用,并提供良好的 OCR 结果

您说您不想使用 API,但我建议您使用 Google 最近发布的 OCR API: https://developers.google.com/vision/text-overview

只需将以下行添加到您的依赖项中:

compile 'com.google.android.gms:play-services-vision:9.2.0'

注意:首次使用时,必须从 google 服务器下载一些文件才能正常工作。确保添加此检查 .isOperational()。之后您可以在没有互联网连接的情况下使用它。

您可以使用 ML Kit 进行图像到文本的识别:

https://firebase.google.com/docs/ml-kit/android/recognize-text