用于对文档进行分类的 Elasticsearch 插件

Elasticsearch plugin to classify documents

是否有 elasticsearch 插件可以让我对输入索引的文档进行分类?

对我来说最好的解决方案是将所有最经常出现的术语(/概念)分类显示在用户可以浏览的一种标签云中。

有办法实现吗?有什么建议吗?

谢谢

基本思路是使用 terms aggregations,每学期产生一个桶。

POST /_search
{
    "aggs" : {
        "genres" : {
            "terms" : { "field" : "genre" }
        }
    }
}

您将获得的响应将按术语出现次数的递减顺序排列:

{
    ...

    "aggregations" : {
        "genres" : {
            "doc_count_error_upper_bound": 0, 
            "sum_other_doc_count": 0, 
            "buckets" : [ 
                {
                    "key" : "jazz",
                    "doc_count" : 10
                },
                {
                    "key" : "rock",
                    "doc_count" : 5
                },
                {
                    "key" : "electronic",
                    "doc_count" : 2
                },
            ]
        }
    }
}

如果您使用的是 Kibana,则可以根据这些术语直接创建 tag cloud 可视化。