如何在 kdb+ 中存储聚合数据

How to store aggregated data in kdb+

我遇到了架构问题：我应该选择什么策略来存储聚合数据。

我知道在某些时间序列数据库中，例如 RRDTools，可以有多个数据库层来存储 1H、1W、1M、1Y 聚合数据。

对 kdb+ 使用相同的策略是否是一种正常做法：拥有多个具有 date/month/year/int（一周和其他）分区的组屋？（关于网关的规则如何找到合适的来源。）

作为替代方案，我考虑将所有数据存储在表名agg 等表中的单个 HDB 中。但是在我看来，它不像几个组屋那样光滑。

做决定时我应该考虑哪些要点？

很难给出一个普遍的答案，因为每个人的要求都不同，但我可以说，根据我的经验，通常的做法是拥有一个按日期分区的 HDB，因为它可以容纳最广泛的历史数据集。在增加聚合粒度方面：

维护许多具有不同分区样式的不同 HDB 对我来说似乎有点过分了。但这同样取决于所涉及的情况和数据量以及数据的预期使用模式。