如何删除 elasticsearch 中索引的所有文档中的元素?

How remove an element in all documents of an index in elasticsearch?

我在 Elasticsearch 的索引中有如下文档列表:

...
{
  "_index" : "index-name",
  "_type" : "_doc",
  "_id" : "table1c7151240c583e60c8e2cbad351",
  "_score" : 0.28322574,
  "_source" : {
    ...
    "table.tag" : {
      "datasources_keys" : [...],
      "tags" : [
        "6e7358e2bfc84c34af32a01f6d19e9b2",
        "ab450ae5c1734fb0aad5fed052b42023",
        "f725e3100bba4b5eb8a5199a2b3e62fc"
      ]
    }
  }
},
...

我想删除所有文档中的一个元素。例如,应该删除 tags 中指定的 tag_id,例如 "6e7358e2bfc84c34af32a01f6d19e9b2"。我应该如何为此编写脚本? elasticsearch还有其他方法吗?

我正在使用这个脚本..但是它不起作用!!

POST index-name/_update_by_query
{
  "query": {
    "match":{
      "table.tag.tags": "6e7358e2bfc84c34af32a01f6d19e9b2"
    }
  },
  "script": {
    "source": "ctx._source['table.tag']['tags'] -= 6e7358e2bfc84c34af32a01f6d19e9b2",
    "lang": "painless"
  }
}

您可以尝试以下脚本:

POST index-name/_update_by_query
{
  "query": {
    "match": {
      "table.tag.tags": "6e7358e2bfc84c34af32a01f6d19e9b2"
    }
  },
 "script": {
    "source": """
    for (int i = 0; i < ctx._source['table.tag']['tags'].length; i++)
    {
      if(ctx._source['table.tag']['tags'][i]=='6e7358e2bfc84c34af32a01f6d19e9b2')
      {
            ctx._source['table.tag']['tags'].remove(i);
      }
    }"""
      }
}

这是一种更简洁的方式,使用隐式列表迭代和 if 条件(+ 它是 one-liner ):

POST index-name/_update_by_query
{
  "query": {
    "match": {
      "table.tag.tags": "6e7358e2bfc84c34af32a01f6d19e9b2"
    }
  },
  "script": {
    "lang": "painless"
    "source": "ctx._source['table.tag']['tags'].removeIf(tag -> tag == params.tag);",
    "params": {
      "tag": "6e7358e2bfc84c34af32a01f6d19e9b2"
    }
  }
}

更新

您可以这样添加第二个条件:

ctx._source['table.tag']['tags'].removeIf(tag -> tag == params.tag);
if (ctx._source['table.tag']['tags'].size() == 0) {
    ctx._source['table.tag'].remove('tags');
}