是否可以使用 Google 脚本将位于 Google 驱动器中的不可搜索的 PDF 转换为可搜索的 PDF?
Is it possible to use Google Script to convert a non-searchable PDF located in Google Drive into a searchable PDF?
我想使用Google Apps Spript将不可搜索的PDF转换成文本覆盖的可搜索PDF在 PDF 上。
PDF 位于我的 Google 驱动器中,我不想将文件上传到其他网站或下载文件以进行转换。
我还没有找到任何资源表明可以像 Adobe Acrobat 进行 OCR 转换一样覆盖文本。那么,是否有可能使用 GAS 进行覆盖?我只看到人们转换为文本或文档文件。
Google 驱动器具有 OCR 识别功能,允许您在上传时将图像/不可搜索的 PDF 转换为 Google Docs 文件,它还具有导出功能,允许您导出 Docs文件到 PDF。但是没有直接转换的方法,在OCR识别过程中格式会丢失。因此,无法创建带叠加的 PDF 文件。
您最好的选择是通过 POST 或应用程序脚本中 UrlFetchApp.fetch()
的 GET 请求调用外部 OCR API。您可以将该方法嵌入到一个函数中,该函数会自动遍历所需的驱动器文件夹,查找所有 pdf 文件并使用它们的 URL 调用外部 OCR API.
我想使用Google Apps Spript将不可搜索的PDF转换成文本覆盖的可搜索PDF在 PDF 上。
PDF 位于我的 Google 驱动器中,我不想将文件上传到其他网站或下载文件以进行转换。
我还没有找到任何资源表明可以像 Adobe Acrobat 进行 OCR 转换一样覆盖文本。那么,是否有可能使用 GAS 进行覆盖?我只看到人们转换为文本或文档文件。
Google 驱动器具有 OCR 识别功能,允许您在上传时将图像/不可搜索的 PDF 转换为 Google Docs 文件,它还具有导出功能,允许您导出 Docs文件到 PDF。但是没有直接转换的方法,在OCR识别过程中格式会丢失。因此,无法创建带叠加的 PDF 文件。
您最好的选择是通过 POST 或应用程序脚本中 UrlFetchApp.fetch()
的 GET 请求调用外部 OCR API。您可以将该方法嵌入到一个函数中,该函数会自动遍历所需的驱动器文件夹,查找所有 pdf 文件并使用它们的 URL 调用外部 OCR API.