AWS Textract 如何测量页数?

How does AWS Textract measure the number of pages?

在亚马逊的定价页面上,它指出俄亥俄州的 US-east-1 定价为每页带表格的文档分析 5 美分。 (https://aws.amazon.com/textract/pricing/)

我想知道页面是如何衡量的——例如,如果表格的图像被裁剪并一起放入一个 PDF 中,这是否仍构成一页?

此外,我知道 Textract 也会对图像进行处理。图片页面在Textract中是如何构成的?

将分析所需的尽可能多的文本嵌入到一个 PDF 页面中是否是一种节省成本的机制,即使这可能会略微降低准确性?

我们公司需要处理超过数百万的纸质表格,这实际上是每月 5,000 美元的账单与亚马逊每月 200,000 美元的账单之间的区别。因此,我们现在被迫以每页 0.1 美分的价格使用 DocumentDetection,但我们想使用目前每页 6 美分的 form/table 数据分析。

在您链接的他们的定价页面上,他们说

A single page may contain between 0 and 3,000 words.

所以我想只要您将所有必要的 <3,000 字项目打包到一页中,您就会为一页付费。