Adobe PDF 服务:神秘(无意义?)错误消息

Adobe PDF Services: Cryptic (Meaningless?) Error Messages

我正在尝试使用 Adob​​e PDF 服务从公司报告 PDF 中提取文本,但我收到了其中一些报告的以下一般错误消息:

    raise SdkException("Request could not be completed. Possible cause attached!", sys.exc_info())
adobe.pdfservices.operation.exception.exceptions.SdkException: description =Request could not be completed. Possible cause attached!, requestTrackingId=(<class 'requests.exceptions.ConnectionError'>, ConnectionError(ProtocolError('Connection aborted.', timeout('The write operation timed out'))), <traceback object at 0x10455d540>)

这不是网络问题,因为:

  1. 我同时从其他 6 个文件中成功提取了文本
  2. 我对每个错误文件都尝试了多次

文件没有损坏,因为我可以在本地查看它们。

我是运行的python代码是由Adobe的Service Account生成并下载到本地文件夹:只更改了输入的文件名。

我使用的是试用账户,只用了 20% 的配额,所以也不是配额错误。

错误文件列表为:

  1. https://www.asahigroup-holdings.com/en/ir/pdf/annual/2019_all.pdf
  2. https://www.csx.com/share/wwwcsx15/assets/File/Responsibility/CSX_ESG_Report_Final_7_30.pdf
  3. https://online.flippingbook.com/view/459148139/(从那里下载)

是否有人(可能是 Adob​​e 员工)能够提供任何 insights/advice 通用错误消息,以便我可以尝试纠正问题?

我在我的 Node.js 环境中测试了这些文件,它们 运行 没问题。如果您愿意,我很乐意与您分享输出。看起来错误是由于超时引起的,我怀疑是因为文件大小实际上并不是那么大。

尝试使用允许您设置自定义超时的示例。 full sample is here 但相关代码在下面。

# Initial setup, create credentials instance.
credentials = Credentials.service_account_credentials_builder()\
    .from_file(base_path + "/pdfservices-api-credentials.json") \
    .build()

# Create client config instance with custom time-outs.
client_config = ClientConfig.builder().with_connect_timeout(10000).with_read_timeout(40000).build()

#Create an ExecutionContext using credentials and create a new operation instance.
execution_context = ExecutionContext.create(credentials, client_config)