CrateDB cpu vs ram vs 更多节点

CrateDB cpu vs ram vs more nodes

我正在尝试在 Google 云中设置 CrateDB 通过 Metabase 进行分析,可用性并不重要,数据可以重新加载,查询速度很重要。最大的 table 是 5000 万行 40 列。所有 table 都被非规范化。

CrateDB 查询性能、节点数、CPU 数量或 RAM 量哪个更有利?

是尝试添加尽可能多的 CPU、尽可能多的 RAM 还是两者的平衡更好?

这取决于您的用例,但通常您会选择混合使用。 但是你所描述的,我会选择:3 个节点 x 4 个 VCPU 4GB RAM

cratedb 是自然分布的,因此您需要 运行 在集群中使用它来利用它的好处。

  • 如果您需要加载大量数据或使用内存密集型查询(如连接、子选择、区分),您需要更多内存。
  • 如果您需要处理大量连接或执行涉及大量分片的操作,则需要更多 CPU。
  • 如果您进行大量摄取,则需要速度更快的光盘和更多的 CPU。

如果有可能,请使用ssds。旋转的光盘会大大减慢 cratedb 的速度。