文件分类 手写或电脑打印

Document classification handwritten or computer printed

我有很多文件,有些是手写的,有些是电脑打印的(扫描images/pdfs)。我想将它们分为计算机打印和手写两组。谁能指导我完成此操作。我正在使用 Google Vision API 进行数据提取,但是我只想从手写文档中提取数据。

添加更多细节,我通过 RPA 工具 UiPath 调用 google vision api,我被限制使用 google vision api 仅用于 data/text 从图像中提取。我不是在寻找机器学习解决方案,例如 Auto ML 或自定义机器学习项目。我正在寻找可以构建小程序来识别文档是计算机打印的还是手写的方法。程序将以图像或pdf作为输入和输出,无论是计算机打印的还是手写的图像或pdf。

如有任何帮助,我们将不胜感激。

你可以看看opencv的template match。因为手写的字几乎永远不会和电脑打印的字一样每次你都可以得到一个字母模板并检查模板结果点。如果它包含您的模板,那么它是计算机打印的。