卡桑德拉与德鲁伊

Cassandra vs Druid

我有一个用例,我必须使用 Apache Spark 分析实时数据。但是我仍然对为我的应用程序选择数据存储感到困惑。分析主要包括聚合、基于 KPI 的身份分析和机器学习工具来预测趋势和分析。 Cassandra 得到了很好的支持,大型​​科技公司已经在生产中使用它。但经过研究,我发现 Druid 比 Cassandra 更快,并且适用于 OLAP 查询,但它的结果与 Count Distinct 等查询不一致。

伙计们,如果有任何相关帮助,我们将不胜感激。谢谢

由于您的用例是分析实时数据,我建议您使用Druid而不是Apache Cassandra。对于 Apache Cassandra,由于其异步 master less 复制,您可能会在实时分析中错过更新的数据。另一方面,Druid 是为实时分析而设计的。

Druid 详情:http://druid.io/druid.html
Apache Cassandra 详情:https://en.wikipedia.org/wiki/Apache_Cassandra