在使用 ContentStreams 时是否可以使用多个字段来用于 MoreLikeThis 中的相似性?
Is it possible use several fields to use for similarity in MoreLikeThis while using ContentStreams?
假设我将 MoreLikeThisHandler 与外部提供的相似文本一起使用,即 "potato",并与我的文档的字段 "title" 和 "description" 进行比较。所以我会有这样的 URL:
http://localhost:8983/solr/my_collection/mlt?stream.body=potato&mlt.fl=title,description
使用 &mlt.interestingTerms=details
检查结果我发现只有第一个指定的字段 "title" 被用于提取 interestingTerms。更改 URL 中指定字段的顺序,第一个字段仍用于 mlt 匹配,"description"。当提供多个单词的文本时,此行为不会改变。
考虑到 Solr Wiki 中的示例也显示了使用 ContentStreams 进行 mlt 相似性查询的两个字段,是否真的可以为此使用多个字段? ("manu" 和 "cat" 字段,https://wiki.apache.org/solr/MoreLikeThisHandler)
我已经有 enableRemoteStreaming="true"
.
(实际上我并没有将文本发布到流主体以获取类似的文档,而是使用 stream.url
从 URL 流式传输文档)
这是 7.4 之前的 Solr 版本中的一个限制它在 7.4 中已修复并且应该可以在该版本或更高版本中使用。有关详细信息,请参阅 https://issues.apache.org/jira/browse/SOLR-5351
假设我将 MoreLikeThisHandler 与外部提供的相似文本一起使用,即 "potato",并与我的文档的字段 "title" 和 "description" 进行比较。所以我会有这样的 URL:
http://localhost:8983/solr/my_collection/mlt?stream.body=potato&mlt.fl=title,description
使用 &mlt.interestingTerms=details
检查结果我发现只有第一个指定的字段 "title" 被用于提取 interestingTerms。更改 URL 中指定字段的顺序,第一个字段仍用于 mlt 匹配,"description"。当提供多个单词的文本时,此行为不会改变。
考虑到 Solr Wiki 中的示例也显示了使用 ContentStreams 进行 mlt 相似性查询的两个字段,是否真的可以为此使用多个字段? ("manu" 和 "cat" 字段,https://wiki.apache.org/solr/MoreLikeThisHandler)
我已经有 enableRemoteStreaming="true"
.
(实际上我并没有将文本发布到流主体以获取类似的文档,而是使用 stream.url
从 URL 流式传输文档)
这是 7.4 之前的 Solr 版本中的一个限制它在 7.4 中已修复并且应该可以在该版本或更高版本中使用。有关详细信息,请参阅 https://issues.apache.org/jira/browse/SOLR-5351