如果我有大量数据,我应该创建多数据流而不是单个数据流

If i have large amount of data, should i create multi data stream instead of a single data stream

如果存储容量大约是几万亿字节,我应该使用单个数据流吗? 像这样:

数据流aaa,包含index:aaa-2022.01.06-0001,aaa-2022.01.06-0002,aaa-2022.01.07-0003

或多个数据流

数据流一:aaa-2022.01.06,包含index:aaa-2022.01.06-2022.01.06-0001

数据流二:aaa-2022.01.07,包含index:aaa-2022.01.07-2022.01.07-0001

显然是前者,因为数据流由 ILM 策略管理,并自动将其基础索引命名为 the index creation date(即 .ds-<data-stream>-<yyyy.MM.dd>-<generation>),因此您不会在数据中也添加当前日期流名称本身。

只需为您的数据流定义适当的 ILM 策略(具有适当的滚动周期 and/or 大小和保留)就可以了。