Adobe PDF 服务:神秘(无意义?)错误消息
Adobe PDF Services: Cryptic (Meaningless?) Error Messages
我正在尝试使用 Adobe PDF 服务从公司报告 PDF 中提取文本,但我收到了其中一些报告的以下一般错误消息:
raise SdkException("Request could not be completed. Possible cause attached!", sys.exc_info())
adobe.pdfservices.operation.exception.exceptions.SdkException: description =Request could not be completed. Possible cause attached!, requestTrackingId=(<class 'requests.exceptions.ConnectionError'>, ConnectionError(ProtocolError('Connection aborted.', timeout('The write operation timed out'))), <traceback object at 0x10455d540>)
这不是网络问题,因为:
- 我同时从其他 6 个文件中成功提取了文本
- 我对每个错误文件都尝试了多次
文件没有损坏,因为我可以在本地查看它们。
我是运行的python代码是由Adobe的Service Account生成并下载到本地文件夹:只更改了输入的文件名。
我使用的是试用账户,只用了 20% 的配额,所以也不是配额错误。
错误文件列表为:
- https://www.asahigroup-holdings.com/en/ir/pdf/annual/2019_all.pdf
- https://www.csx.com/share/wwwcsx15/assets/File/Responsibility/CSX_ESG_Report_Final_7_30.pdf
- https://online.flippingbook.com/view/459148139/(从那里下载)
是否有人(可能是 Adobe 员工)能够提供任何 insights/advice 通用错误消息,以便我可以尝试纠正问题?
我在我的 Node.js 环境中测试了这些文件,它们 运行 没问题。如果您愿意,我很乐意与您分享输出。看起来错误是由于超时引起的,我怀疑是因为文件大小实际上并不是那么大。
尝试使用允许您设置自定义超时的示例。 full sample is here 但相关代码在下面。
# Initial setup, create credentials instance.
credentials = Credentials.service_account_credentials_builder()\
.from_file(base_path + "/pdfservices-api-credentials.json") \
.build()
# Create client config instance with custom time-outs.
client_config = ClientConfig.builder().with_connect_timeout(10000).with_read_timeout(40000).build()
#Create an ExecutionContext using credentials and create a new operation instance.
execution_context = ExecutionContext.create(credentials, client_config)
我正在尝试使用 Adobe PDF 服务从公司报告 PDF 中提取文本,但我收到了其中一些报告的以下一般错误消息:
raise SdkException("Request could not be completed. Possible cause attached!", sys.exc_info())
adobe.pdfservices.operation.exception.exceptions.SdkException: description =Request could not be completed. Possible cause attached!, requestTrackingId=(<class 'requests.exceptions.ConnectionError'>, ConnectionError(ProtocolError('Connection aborted.', timeout('The write operation timed out'))), <traceback object at 0x10455d540>)
这不是网络问题,因为:
- 我同时从其他 6 个文件中成功提取了文本
- 我对每个错误文件都尝试了多次
文件没有损坏,因为我可以在本地查看它们。
我是运行的python代码是由Adobe的Service Account生成并下载到本地文件夹:只更改了输入的文件名。
我使用的是试用账户,只用了 20% 的配额,所以也不是配额错误。
错误文件列表为:
- https://www.asahigroup-holdings.com/en/ir/pdf/annual/2019_all.pdf
- https://www.csx.com/share/wwwcsx15/assets/File/Responsibility/CSX_ESG_Report_Final_7_30.pdf
- https://online.flippingbook.com/view/459148139/(从那里下载)
是否有人(可能是 Adobe 员工)能够提供任何 insights/advice 通用错误消息,以便我可以尝试纠正问题?
我在我的 Node.js 环境中测试了这些文件,它们 运行 没问题。如果您愿意,我很乐意与您分享输出。看起来错误是由于超时引起的,我怀疑是因为文件大小实际上并不是那么大。
尝试使用允许您设置自定义超时的示例。 full sample is here 但相关代码在下面。
# Initial setup, create credentials instance.
credentials = Credentials.service_account_credentials_builder()\
.from_file(base_path + "/pdfservices-api-credentials.json") \
.build()
# Create client config instance with custom time-outs.
client_config = ClientConfig.builder().with_connect_timeout(10000).with_read_timeout(40000).build()
#Create an ExecutionContext using credentials and create a new operation instance.
execution_context = ExecutionContext.create(credentials, client_config)