more_like_this 不适用于字段中重复的相同文本

more_like_this is not working for repeated same text in field

我们正在使用 elasticsearch 6.0 来找出 elasticsearch 索引中的相似组件。为此,我们使用 more_like_this。字段中重复的文本没有得到正确的结果

1) 第一个组件字段的文本如下:

fan fan fan in the room

2) 第二个组件字段的文本如下:

one two three fan fan fan in the room.

当我尝试找出与第一个组件类似的组件时,elk 没有显示任何结果。

如何获得适用于重复文本以及字段中唯一词的弹性搜索结果。

注意:-我们将无法添加 min_term_freq。

默认情况下 min_doc_freq 为 5,因此您的查询不起作用,因为您的索引不包含至少 5 个术语 属性 为黄色的文档。因此,在您的查询中将 min_doc_freq 设置为 1,它应该可以工作。

{
    "query": {
        "more_like_this": {
            "like": "Hello",
            "min_term_freq": 1,
            "min_doc_freq": 1
        }
    }
}

作为参考我们可以去