Elasticsearch 映射中 FielddataLoading.Eager 选项的替代品是什么?

What is the replacement for FielddataLoading.Eager option in Elasticsearch mapping?

我正在将应用程序从 Elasticsearch 2.3 升级到 7.9。我正在使用显示与 ES 7.9 兼容的 NEST 客户端版本 7.11.1。我们使用的是 7.9,因为这是我们正在使用的 AWS 服务器上可用的最新版本。

旧应用程序具有以下字段映射:

.String(s => s
    .Name(f => f.PartDescription)
    .Analyzer(Analyzers.DescriptionAnalyzer)
    .Fielddata(descriptor => descriptor.Loading(FielddataLoading.Eager)));

我正在使用以下映射在新版本中替换它:

.Text(t => t
    .Name(ep => ep.PartDescription)
    .Analyzer(Analyzer.DescriptionAnalyzer)
    .Fielddata(true))

我看到在新版本中,Fielddata 的唯一选项是布尔值。缺少 Eager 和其他选项。

Fielddata(true) 是否适合升级?

fielddata 上的布尔值确定是否为该字段启用 fielddatafielddata 在执行聚合、排序和编写脚本时使用,并按需加载到堆中、字段数据缓存中(不是急切加载)。

通常用于 text datatype fields, you don't want fielddatatext 数据类型经过分析,生成的标记存储在倒排索引中。当 fielddata 设置为 true 时,倒排索引按需进行非倒排以生成一个列式结构,该结构被加载到堆中以服务于 text 字段上的聚合、排序和脚本。文本分析通常会产生许多标记,这些标记可以很好地服务于全文搜索的目的,但不能很好地服务于聚合、排序和脚本编写的目的。使用 many 令牌和 many 并发聚合,堆内存可以快速增长,施加 GC 压力。因此,text 数据类型字段的默认设置是 fielddatafalse,如果您知道自己在做什么,则将其设置为 true

不是在 text 数据类型字段上将 fielddata 设置为 true,如果该字段是您要用于聚合、排序和脚本,并为此目的定位 keyword 多字段。