使用 kofax 处理文档的不同布局

Handle different layout of document using kofax

kofax

我是 KofaxTotalAgility 解决方案的新手，但我很了解 OCR、OMR 和识别机制。

我在一个文件夹中有两个表格，A 和 B。两者相同，但由于手动扫描，轴有轻微变化，比如右移 20 像素，因此布局略有不同。

Image A and Image B版式不同，页面中表格位置不固定。我知道，其他解决方案，如 "abbyy fine reader"，提供灵活布局，我们可以通过查找文本并设置从右到左从上到下自动识别区域来处理此问题。

因为我已经开始学习 KofaxTotalAgility，所以我不知道 "kofax Transformation Designer" 提供的所有选项。

我的问题是我应该使用哪个定位器，我目前是 using/working-on 高级区域定位器，对于我设置为参考的一个文档（图像 A），提取是正确的。但对于其他（图 B），由于布局不匹配 text/box 字段未被提取。

任何人都可以指出正确的方向，从哪里我可以妥善处理这个案子。我知道，我是直接询问 option/solution，非常感谢任何帮助。

通常，Kofax Transformations 有两组定位器：

确定性。您准确地告诉定位器要做什么以及如何做（类似于编程时的命令式方法）
概率。您只需告诉您的定位器要提取什么，它就会计算出其余部分（基于 AI）。

这是我前几天创建的（非详尽的）图表：

使用表单时，您可能会倾向于依赖特定于表单的定位器，例如 Advanced Zone Locator。虽然此定位器可以考虑字段 "moving around"，例如由于图像被颠簸、缩放或扭曲，但存在某些限制。其他定位器没有这些限制 - 例如，格式定位器允许您定义特定模式（正则表达式），该模式应与必须在该模式周围某处找到的关键字一起匹配。

对于您的示例，您可以创建一个像 M|F|X 这样的正则表达式，然后将 "Gender" 定义为需要出现在左侧的关键字。

但是，任何受决定论支配的定位器都遵循墨菲定律——在某些时候，该关键字可能会发生变化。可能有不同的语言。也许可以为某些性别添加额外的字母；最终破坏了您的提取逻辑。

进入 AI - 虽然墨菲定律在使用组定位器时仍然适用，但这里的区别在于用户可以训练系统来获取新数据。所述定位器将自动计算出提取该数据的最佳方式。如果您使用格式定位器，客户将需要与您联系以添加其他表达式或更改关键字。

在您的特定情况下，我会先尝试使用 Trainable Group Locator。如果您已经知道要查找的内容 - 例如数据库中某处的 SSN，请使用 Database Locator。使用 Format Locators 作为最后的手段，尽管它们可能很诱人。 高级区域定位器 在处理表单时很有用，但我发现自己几乎完全将它们用于手印或复选框识别。