AWS Comprehend 是否对图像进行分类?

Does AWS Comprehend classify images?

我对 AWS Comprehend 还很陌生。我知道 AWS Comprehend 可以自定义分类文档(文本文件)。 AWS Comprehend 是否也对图像文件进行分类?此外,在训练模型时,是否有必要在 CSV 中提供整个文档文本,还是只提供关键字?

原因是,我想构建一个自定义分类器,可以对发票、工资单和其他一些图像格式的文档类型进行分类。领悟能做到吗?如果有怎么办?

用 Google 搜索了很多,但找不到任何相关的东西。非常感谢您对此的帮助。

谢谢!

Comprehend 本身不会执行此操作,因此您必须构建一个解决方案。您可以尝试组合 Amazon Textract(用于从文档中提取详细信息)然后 Comprehend 对它们进行分类。

在常见问题解答中,Textract 将此称为常见用例。我找不到有人这样做的确切例子,但在 documentation.

中直接调用了它

Amazon Comprehend 仅适用于文本。

Amazon Rekognition 处理图像。

AWS 拥有实现此目的的所有构建块,但您必须 configure/build 自己完成。您可以使用 AWS Textract 从文档中提取所有文本,然后将文本传递到 AWS Comprehend 服务中以进行文档类型分类。

在执行此操作之前,您需要训练 Comprehend 的机器学习部分以正确识别文档类型。您需要在 AWS Comprehend 中配置和训练自定义分类器,您可以在其中提供包含分类列表的 CSV 文件,例如 'document type',然后是文档类型中的文本。如果它只是表单,那么您可以使用 Textract 表单功能仅获取键值对,然后使用键(表单中的标签)作为自定义分类器的文本。