您如何在 Google Search Appliance 中为大型文件编制索引?

How do you index large files in Google Search Appliance?

我有一个客户,主要有扫描的合同和文件的 PDF 文件。 PDF 已经过 OCR 处理,文本作为正文插入。我们遇到了一个问题,即超过 100MB 的文档会产生转换文本错误,并且不会在 GSA 中为文本内容编制索引。

我们正在使用外部文件共享连接器来提供和抓取文档。

我们如何增加最大大小并处理超过 100MB 的 PDF 文档?

根据 documentation,您可以在管理控制台的主机负载设置页面上更改这些最大值。

请注意,在 GSA 中,大文件中的文本量将被截断。 https://support.google.com/gsa/answer/4411411?hl=en

有许多替代 GSA 且不截断的解决方案 http://fortune.com/2016/05/27/google-search-appliance-gone/