我可以根据重复字段查找文档吗?

Can I find documents based on duplicated fields?

我有一个 Solr 服务器,其数据格式如下:

{
  id: 1,
  text_1: "some_text1",
  text_2: "some_text2",
},
{
  id: 2,
  text_1: "some_text1",
  text_2: "some_text2",
}

我需要找到像我上面写的那些文件。 "text_1" 和 "text_2" 值相同但 ID 不同的文档。

我试过使用 facets,但我不确定它是否有帮助。首先,它只有 returns 个重复项计数,我需要这些文档的 ID。其次,我不确定对多个字段进行分面是否符合我的要求。我不确定: facet.field=text_1&facet.field=text_2 显示了包含这两个字段的文档数。

谢谢,我对Solr了解不多。非常感谢任何帮助!

我认为 facets 是完成这项工作的最佳选择,但正如您所注意到的,您至少需要发出两个查询:一个用于获取 facets,另一个用于获取属于该 facet 的实际文档(即在你的情况下重复)

要让多方面为您尝试做的事情工作,您需要使用 PivotFaceting (https://lucene.apache.org/solr/guide/7_0/faceting.html#pivot-decision-tree-faceting)。语法是 facet=on&facet.pivot=field1,field2

确保您用于构面的字段是 string 字段而不是 text 字段。