所有带 URL 和标题的索引 PDF 的报告

Report of all indexed PDFs with URL and Title

我有一个 GSA 索引大约 15,000 个文档。在我们的主网站上使用 GSA 一段时间后,我们发现我们的大量 PDF 文件命名不正确。

为了更正错误,我们想从 GSA 获取所有 PDF 的列表,以及它们的 URL 和它们在搜索结果中的标题。

是否可以从 GSA 中提取此类报告?

您可以从 GSA 导出所有网址,然后使用文本编辑器(或电子表格应用程序)查看它们。如果您有大量 URL,那么您可能需要先在纯文本编辑器中打开,然后只提取其中包含 PDF 的行。

您的问题包含标题,但两个答案都没有帮助。 这在 GSA 中是不可能的,但可以使用其他方法。 如果您可以访问 pdf 的存储位置,则可能是最简单的方法。然后使用 Nitro pdf 软件,它可以批量列出 pdf 中的标题和其他元数据,然后您可以从 xls 文件批量更改它们。 几年前,我对 500 多个 pdf 文件进行了此操作,而且这个价格很划算。我不为 Nitro 工作,也没有任何从属关系。只需要完成一项任务,它就做到了。 它唯一不能做的就是重命名文件。但是 GSA 在 pdf 中使用并显示元数据标题,因此这确实是最重要的正确标题。