在 default_collection 中搜索减去特定的 collection

Search in default_collection minus a specific collection

在我们的 500K 文档的 GSA 索引中,一半文档来自内部错误跟踪系统。 我们一直听到一些高级用户抱怨错误跟踪系统的结果压低了来自许多其他来源的其他有用结果。 我们讨论了使用结果偏差来降低错误跟踪文档的重要性,但我不太喜欢这种方法,因为我认为我们应该让 GSA 发挥其魔力并决定结果的相关性。 相反,我想为用户提供的选项是 UI(每个 collection 的复选框),他们可以在其中选择要执行搜索的 collection。

我的 non-default collection 不包括 default_collection 下的所有内容。因此,当用户检查每个复选框时,他们可能会认为索引中的所有内容都是如此,但事实并非如此。 因此,我希望复选框表现为排除而不是包含(即检查以排除此 collection)。

最后我的问题是:有没有一种方法可以在默认 collection 中搜索但过滤掉属于特定 collection 的结果(错误跟踪 collection)。 当您想使用多个 collection 时,您可以 &site=col1|col2|col3.. 我所追求的是 &site=default_collection-col1(介于两者之间的负号)。

有办法吗?

这个问题有什么替代方法吗?

到目前为止,最好的方法是在您的 collection 配置中。只需创建一个与默认 collection 具有相同包含模式的新 collection,并将错误跟踪 collection 中的模式添加为排除模式。

除非您使用“|”列出每个人 collection,否则无法纯粹使用查询参数来完成您的要求除了你想要的那一个然后你可能 运行 进入 URL 长度问题。

就个人而言,我会重新考虑您的 collections 的设计并构建您可以包含的更多模块化 collections。正如您提到的那样,您可以在您的网站中包含或查询 include。

http://www.google.com/support/enterprise/static/gsa/docs/admin/70/gsa_doc_set/xml_reference/request_format.html#1076953

一个不太理想但更具体的解决方案是在搜索查询中通过 URL 进行排除,请注意这可能会出现在结果查询搜索框中并且看起来很难看,但这可以使用简单的 XSLT 更改即可修复。

要排除特定网站的结果 (http://www.google.com/support/enterprise/static/gsa/docs/admin/70/gsa_doc_set/xml_reference/request_format.html#1076964),我会谨慎使用它并选择更好的 collections 设计。

更新您的前端以排除针对错误跟踪集合提到的 url 模式。 勾选你盒子上的 url http://yourGSAEnterpriseCcontroller:8000/EnterpriseController/serve_remove.html