是否可以为一组自定义输入字符配置 OCR 库?
Is it possible to configure an OCR library for only a custom set of input characters?
我正在考虑创建一个 Android 应用程序来识别给定图像中的一组给定字符 [假设只是 A、E、I、O、U],仅此而已.有没有一种方法可以利用现有的开源 OCR 库并根据需要配置 language/character 输入?如果是,我该怎么做?
非常感谢您的帮助。
首先让我告诉您,在 Android(或一般)中使用 OCR 对于 OpenSource 库来说并非易事。
你能找到的最好的库(相信我,我试过好几个)是 Tesseract with its Android port
使用 tesseract,您可以 'train'(正如他们所说)识别自定义字体或特定字体,您可以设置主要语言来处理图像,您还可以使用:
engine.setVariable("tessedit_char_whitelist", "aeiou");
所以它只能识别某些字符。好了,开始研究 Tesseract!
我正在考虑创建一个 Android 应用程序来识别给定图像中的一组给定字符 [假设只是 A、E、I、O、U],仅此而已.有没有一种方法可以利用现有的开源 OCR 库并根据需要配置 language/character 输入?如果是,我该怎么做?
非常感谢您的帮助。
首先让我告诉您,在 Android(或一般)中使用 OCR 对于 OpenSource 库来说并非易事。
你能找到的最好的库(相信我,我试过好几个)是 Tesseract with its Android port
使用 tesseract,您可以 'train'(正如他们所说)识别自定义字体或特定字体,您可以设置主要语言来处理图像,您还可以使用:
engine.setVariable("tessedit_char_whitelist", "aeiou");
所以它只能识别某些字符。好了,开始研究 Tesseract!