使用 OCR 解析和分析收据
Parsing and analysing the Receipts using OCR
我正在开展一个项目,可以使用 OCR 读取收据并对其进行解析以获取商家名称、日期、金额等重要信息。我正在使用 vision API google 解析图像并以 JSON 格式从中获取文本。现在我想进入下一步,在那里我可以解析文本并尝试通过它的位置或 expressions.Right 来识别信息,现在我能够从简单货币中提取金额,后跟数字字符串。从这一点来看,我应该在哪里寻找分析文本以提取任何信息(尝试开发一个可以从任何类型的收据中提取信息的系统)。即使是很小的领先优势也会帮助我前进。
谢谢。
我开始通过查找 "Date"、"Amount"、"total"、"Rs" 等标记从返回的文本格式中提取信息。我开发了一种算法,将发现的不同数字排列为实际数量。此外,我还通过删除诸如 ("the"、"in" 、 "welcome" ) 等标记来获取在大多数情况下位于收据顶部的商家名称
我正在开展一个项目,可以使用 OCR 读取收据并对其进行解析以获取商家名称、日期、金额等重要信息。我正在使用 vision API google 解析图像并以 JSON 格式从中获取文本。现在我想进入下一步,在那里我可以解析文本并尝试通过它的位置或 expressions.Right 来识别信息,现在我能够从简单货币中提取金额,后跟数字字符串。从这一点来看,我应该在哪里寻找分析文本以提取任何信息(尝试开发一个可以从任何类型的收据中提取信息的系统)。即使是很小的领先优势也会帮助我前进。
谢谢。
我开始通过查找 "Date"、"Amount"、"total"、"Rs" 等标记从返回的文本格式中提取信息。我开发了一种算法,将发现的不同数字排列为实际数量。此外,我还通过删除诸如 ("the"、"in" 、 "welcome" ) 等标记来获取在大多数情况下位于收据顶部的商家名称