用于对文档进行分类的 Elasticsearch 插件
Elasticsearch plugin to classify documents
是否有 elasticsearch 插件可以让我对输入索引的文档进行分类?
对我来说最好的解决方案是将所有最经常出现的术语(/概念)分类显示在用户可以浏览的一种标签云中。
有办法实现吗?有什么建议吗?
谢谢
基本思路是使用 terms
aggregations,每学期产生一个桶。
POST /_search
{
"aggs" : {
"genres" : {
"terms" : { "field" : "genre" }
}
}
}
您将获得的响应将按术语出现次数的递减顺序排列:
{
...
"aggregations" : {
"genres" : {
"doc_count_error_upper_bound": 0,
"sum_other_doc_count": 0,
"buckets" : [
{
"key" : "jazz",
"doc_count" : 10
},
{
"key" : "rock",
"doc_count" : 5
},
{
"key" : "electronic",
"doc_count" : 2
},
]
}
}
}
如果您使用的是 Kibana,则可以根据这些术语直接创建 tag cloud 可视化。
是否有 elasticsearch 插件可以让我对输入索引的文档进行分类?
对我来说最好的解决方案是将所有最经常出现的术语(/概念)分类显示在用户可以浏览的一种标签云中。
有办法实现吗?有什么建议吗?
谢谢
基本思路是使用 terms
aggregations,每学期产生一个桶。
POST /_search
{
"aggs" : {
"genres" : {
"terms" : { "field" : "genre" }
}
}
}
您将获得的响应将按术语出现次数的递减顺序排列:
{
...
"aggregations" : {
"genres" : {
"doc_count_error_upper_bound": 0,
"sum_other_doc_count": 0,
"buckets" : [
{
"key" : "jazz",
"doc_count" : 10
},
{
"key" : "rock",
"doc_count" : 5
},
{
"key" : "electronic",
"doc_count" : 2
},
]
}
}
}
如果您使用的是 Kibana,则可以根据这些术语直接创建 tag cloud 可视化。