more_like_this 不适用于字段中重复的相同文本
more_like_this is not working for repeated same text in field
我们正在使用 elasticsearch 6.0 来找出 elasticsearch 索引中的相似组件。为此,我们使用 more_like_this。字段中重复的文本没有得到正确的结果
1) 第一个组件字段的文本如下:
fan fan fan in the room
2) 第二个组件字段的文本如下:
one two three fan fan fan in the room.
当我尝试找出与第一个组件类似的组件时,elk 没有显示任何结果。
如何获得适用于重复文本以及字段中唯一词的弹性搜索结果。
注意:-我们将无法添加 min_term_freq。
默认情况下 min_doc_freq 为 5,因此您的查询不起作用,因为您的索引不包含至少 5 个术语 属性 为黄色的文档。因此,在您的查询中将 min_doc_freq 设置为 1,它应该可以工作。
{
"query": {
"more_like_this": {
"like": "Hello",
"min_term_freq": 1,
"min_doc_freq": 1
}
}
}
作为参考我们可以去
我们正在使用 elasticsearch 6.0 来找出 elasticsearch 索引中的相似组件。为此,我们使用 more_like_this。字段中重复的文本没有得到正确的结果
1) 第一个组件字段的文本如下:
fan fan fan in the room
2) 第二个组件字段的文本如下:
one two three fan fan fan in the room.
当我尝试找出与第一个组件类似的组件时,elk 没有显示任何结果。
如何获得适用于重复文本以及字段中唯一词的弹性搜索结果。
注意:-我们将无法添加 min_term_freq。
默认情况下 min_doc_freq 为 5,因此您的查询不起作用,因为您的索引不包含至少 5 个术语 属性 为黄色的文档。因此,在您的查询中将 min_doc_freq 设置为 1,它应该可以工作。
{
"query": {
"more_like_this": {
"like": "Hello",
"min_term_freq": 1,
"min_doc_freq": 1
}
}
}
作为参考我们可以去