AWS Comprehend 是否对图像进行分类?
Does AWS Comprehend classify images?
我对 AWS Comprehend 还很陌生。我知道 AWS Comprehend 可以自定义分类文档(文本文件)。 AWS Comprehend 是否也对图像文件进行分类?此外,在训练模型时,是否有必要在 CSV 中提供整个文档文本,还是只提供关键字?
原因是,我想构建一个自定义分类器,可以对发票、工资单和其他一些图像格式的文档类型进行分类。领悟能做到吗?如果有怎么办?
用 Google 搜索了很多,但找不到任何相关的东西。非常感谢您对此的帮助。
谢谢!
Comprehend 本身不会执行此操作,因此您必须构建一个解决方案。您可以尝试组合 Amazon Textract(用于从文档中提取详细信息)然后 Comprehend 对它们进行分类。
在常见问题解答中,Textract 将此称为常见用例。我找不到有人这样做的确切例子,但在 documentation.
中直接调用了它
Amazon Comprehend 仅适用于文本。
Amazon Rekognition 处理图像。
AWS 拥有实现此目的的所有构建块,但您必须 configure/build 自己完成。您可以使用 AWS Textract 从文档中提取所有文本,然后将文本传递到 AWS Comprehend 服务中以进行文档类型分类。
在执行此操作之前,您需要训练 Comprehend 的机器学习部分以正确识别文档类型。您需要在 AWS Comprehend 中配置和训练自定义分类器,您可以在其中提供包含分类列表的 CSV 文件,例如 'document type',然后是文档类型中的文本。如果它只是表单,那么您可以使用 Textract 表单功能仅获取键值对,然后使用键(表单中的标签)作为自定义分类器的文本。
我对 AWS Comprehend 还很陌生。我知道 AWS Comprehend 可以自定义分类文档(文本文件)。 AWS Comprehend 是否也对图像文件进行分类?此外,在训练模型时,是否有必要在 CSV 中提供整个文档文本,还是只提供关键字?
原因是,我想构建一个自定义分类器,可以对发票、工资单和其他一些图像格式的文档类型进行分类。领悟能做到吗?如果有怎么办?
用 Google 搜索了很多,但找不到任何相关的东西。非常感谢您对此的帮助。
谢谢!
Comprehend 本身不会执行此操作,因此您必须构建一个解决方案。您可以尝试组合 Amazon Textract(用于从文档中提取详细信息)然后 Comprehend 对它们进行分类。
在常见问题解答中,Textract 将此称为常见用例。我找不到有人这样做的确切例子,但在 documentation.
中直接调用了它Amazon Comprehend 仅适用于文本。
Amazon Rekognition 处理图像。
AWS 拥有实现此目的的所有构建块,但您必须 configure/build 自己完成。您可以使用 AWS Textract 从文档中提取所有文本,然后将文本传递到 AWS Comprehend 服务中以进行文档类型分类。
在执行此操作之前,您需要训练 Comprehend 的机器学习部分以正确识别文档类型。您需要在 AWS Comprehend 中配置和训练自定义分类器,您可以在其中提供包含分类列表的 CSV 文件,例如 'document type',然后是文档类型中的文本。如果它只是表单,那么您可以使用 Textract 表单功能仅获取键值对,然后使用键(表单中的标签)作为自定义分类器的文本。