Solr:相关领域的研究
Solr: research in fields with relevance
我使用的是 Solr 5.4.1,所有文档都具有以下 XML 结构:
<?xml version ="1.0" ?>
<add >
<doc >
<field name ="title">US, Qatar Extend Talks OverFormer Taliban Detainees - Wall Street Journal</field>
<field name ="date">2015-05-31T23:39:45Z</field>
<field name ="description">The U.S. and Qatari governments have extended talks over the fate of five former Afghan Taliban prisoners ho were released from the Guantanamo Bay prison a year ago in exchange for an American soldier , U.S. officials said Sunday.</field>
</doc >
</add >
从结构体可以看出,有字段title
和description
。
我想做一些测试:
1) 在两个字段中搜索文本,就好像它们是一个 UNIQUE 字段一样。
2) 在两个字段中搜索文本,为每个字段赋予不同的相关权重(例如 80% 到 description
和 20% 到 title
)。
我知道我们可以使用参数qf
来指定搜索的位置(字段);但我知道还有布尔运算符 AND
在参数 q
.
中指定
我可以使用上述哪一种技术来进行每项测试?
如果您想将两个字段作为一个字段进行搜索,请添加一个新字段(即 title_description
)并使用两个 copyField
指令从两个字段复制内容进入公共领域:
您可以将 qf
与 description^4 title
结合使用,使描述中的任何匹配项的权重是标题中任何匹配项的权重的四倍。这将为您提供 80/20 的比率,但请记住,评分比字段之间的简单百分比权重更复杂 - 内容的长度、术语出现的次数、字段之间的位置(如果使用短语提升)等
我使用的是 Solr 5.4.1,所有文档都具有以下 XML 结构:
<?xml version ="1.0" ?>
<add >
<doc >
<field name ="title">US, Qatar Extend Talks OverFormer Taliban Detainees - Wall Street Journal</field>
<field name ="date">2015-05-31T23:39:45Z</field>
<field name ="description">The U.S. and Qatari governments have extended talks over the fate of five former Afghan Taliban prisoners ho were released from the Guantanamo Bay prison a year ago in exchange for an American soldier , U.S. officials said Sunday.</field>
</doc >
</add >
从结构体可以看出,有字段title
和description
。
我想做一些测试:
1) 在两个字段中搜索文本,就好像它们是一个 UNIQUE 字段一样。
2) 在两个字段中搜索文本,为每个字段赋予不同的相关权重(例如 80% 到 description
和 20% 到 title
)。
我知道我们可以使用参数qf
来指定搜索的位置(字段);但我知道还有布尔运算符 AND
在参数 q
.
我可以使用上述哪一种技术来进行每项测试?
如果您想将两个字段作为一个字段进行搜索,请添加一个新字段(即
title_description
)并使用两个copyField
指令从两个字段复制内容进入公共领域:您可以将
qf
与description^4 title
结合使用,使描述中的任何匹配项的权重是标题中任何匹配项的权重的四倍。这将为您提供 80/20 的比率,但请记住,评分比字段之间的简单百分比权重更复杂 - 内容的长度、术语出现的次数、字段之间的位置(如果使用短语提升)等