是否可以使用 Google 脚本将位于 Google 驱动器中的不可搜索的 PDF 转换为可搜索的 PDF?

Is it possible to use Google Script to convert a non-searchable PDF located in Google Drive into a searchable PDF?

我想使用Google Apps Spript将不可搜索的PDF转换成文本覆盖的可搜索PDF在 PDF 上。

PDF 位于我的 Google 驱动器中,我不想将文件上传到其他网站或下载文件以进行转换。

我还没有找到任何资源表明可以像 Adob​​e Acrobat 进行 OCR 转换一样覆盖文本。那么,是否有可能使用 GAS 进行覆盖?我只看到人们转换为文本或文档文件。

Google 驱动器具有 OCR 识别功能,允许您在上传时将图像/不可搜索的 PDF 转换为 Google Docs 文件,它还具有导出功能,允许您导出 Docs文件到 PDF。但是没有直接转换的方法,在OCR识别过程中格式会丢失。因此,无法创建带叠加的 PDF 文件。

您最好的选择是通过 POST 或应用程序脚本中 UrlFetchApp.fetch() 的 GET 请求调用外部 OCR API。您可以将该方法嵌入到一个函数中,该函数会自动遍历所需的驱动器文件夹,查找所有 pdf 文件并使用它们的 URL 调用外部 OCR API.