关于 card.io 个字符识别模型的说明

Clarification about card.io models for character recognition

我开始查看 card.io 作为 Android 应用程序的一部分,该应用程序应该能够扫描卡并识别卡号、到期日期、持卡人。

挖掘了一段时间后,我找到了 card.io-dmz/models/generated 文件夹,根据开头的评论,我在其中看到的文件是 "Autogenerated from models/conv/..."。

但是我无法找到有关用于生成这些 "models" 的文件的详细信息。检查代码后,我认为这些生成的文件直接负责卡片中数字的OCR。

举个例子,下面的卡片被扫描并识别得很好(仅限数字)

但是下面的卡失效了

我尝试在垂直分割完成之前调整ROI,但我认为两张卡片上使用的字体不同导致无法扫描第二张卡片。

我的问题真的是,考虑到目前来自 git hub 的开源项目,有人是否有机会添加类似于上面黑色的扫描卡的功能,或者这需要有访问用于执行实际 OCR 的其他资源?

Dave 来自 card.io 这里。

@Adrian 你的结论都是正确的。

虽然我们很乐意扩展我们的 deep-learning 字符识别模型以涵盖更新样式的卡片,例如上面的第二张卡片,但这是一项艰巨的任务。

首先需要更新定位卡号的代码,然后训练新的字符识别模型,需要相当多的新型卡片 (~100)。

目前,这不适合开源。出于某种原因,人们往往不想分享他们信用卡的图像。

我们考虑过创建一个开源应用程序,该应用程序可用于收集卡片图像的某些部分(例如,所有数字 位置 ,加上只是的实际图像一些数字,加上到期日期的图像)。然后也许我们可以众包大量有用的信息。在构建该集合的同时,我们可以致力于开源我们为处理计算机视觉和深度学习而创建的许多内部工具。

这样的项目你会参与吗?