您可以在 Elasticsearch 中自动创建的索引中将字段设置为 not_analyzed 吗?

Can you set a field to not_analyzed in an auto created index in Elasticsearch?

作为我们 AWS 基础设施的一部分,我正在使用 Elasticsearch (7.4) 索引。我们使用 Terraform 在 AWS Elasticsearch 中创建域,但我们没有显式创建索引。相反,当发布第一个文档时,会自动创建索引。这很有效,但现在我被要求有一个未分析的字段(用户 ID)。

有没有办法在放第一个文档的时候做一个字段not_analyzed

如果不是,我有什么选择可以将字段设置为not_analyzed?我应该做某种 init/bootstrapping 吗?也许有一种方法可以从 Terraform 做到这一点。该应用程序使用 Chalice 构建并在 Lambda 中运行。在这种情况下,不确定如何在 Lambda 中进行初始化。理想情况下,我会一次性触发此调用:

PUT /my_index
{
    "mappings" : {
          "properties" : {
              "user_id" : {
                  "type" : "string",
                  "index" : "not_analyzed" 
              }
          }
    }

}

重新启动应用程序时,将再次发送此调用,但我猜它是不可变的 (PUT)。

这并没有直接回答你的问题,但对于你的问题,我会建议一个 Elasticsearch 之外的解决方案:

  • 在 Terraform 中提供第二个 Lambda 函数,该函数将被允许对 Elasticsearch 进行 运行 PUT 操作,并且其唯一目的是创建您的索引。
  • 在 Terraform 中,创建域后调用此 lambda 函数

换句话说,执行您问题中提到的引导程序,但将其移至单独的 lambda 函数,而不是将其混合到您的应用程序 lambda 中。

这可能有点矫枉过正,但我​​会考虑使用 index template feature

这可能看起来像

PUT _index_template/template_1
{
  "index_patterns": [
    "my_template*"
  ],
  "template": {
    "mappings": {
      "properties": {
        "user_id" : {
          "type" : "keyword"
        }
      }
    }
  },
  "priority": 1
}

它可以使用专用 provider 进行改造 - 它还使用 IAM 密钥直接与 AWS Elasticsearch 集成。

然后以这种方式创建的第一个文档也将使用给定的模板构建索引(当然,如果名称与模式匹配)