DocumentAI如何批量发送文件?

How to batch send documents in DocumentAI?

我正在使用示例 here 中的费用解析器执行 processDocument 流程。由于billing太贵了,我没有一个一个发,而是把10个文档合并成一个pdf,再用processDocument。但是,DocumentAI 看到 10 个单独的收据,我们将它们合并为一个收据,而不是为每个收据返回 10 个不同的 total_amount 实体,1 total_amount returns.I 想要将 10 个文档合并为一个pdf 并以​​较低的结算成本发送。此外,我正在寻找一种方法来独立思考每个文档并分别提取其实体。批处理对我有用吗?我能为它做些什么?你能帮帮我吗?

遗憾的是,没有办法使计费更便宜,因为 Document AI 的定价是按 page/document 计算的。参见 Document AI pricing

关于您的问题:

I am looking for a way to think of each document independently from each other and extract its entities separately. Will batch processing work for me?

是的,批处理适合您,但定价与 processDocument 相同。请参阅我在上面附加的定价信息。

批处理与 processDocument 之间的唯一区别在于,批处理不是针对单个文档发送单个请求,而是在单个请求中发送所有文档。然后,响应将存储在您在批处理选项中定义的 GCS 存储桶中。参见 batch process sample code

要添加的另一件事是批处理异步处理文档。这意味着当发送请求时,处理在后端完成,您可以轮询请求的状态以查看它是否仍在处理或已完成。