哪种 NoSQL 技术可以替代 MOLAP 多维数据集进行即时查询?

Which NoSQL technology can replace MOLAP cubes for instantaneous queries?

我想知道您能否告诉我在我的方案中应该使用哪个 NoSQL db 或 technology/tools。我们正在考虑用开源技术替换基于 SQL 服务器分析服务的 OLAP 多维数据集,因为数据变得太大而无法管理,而且查询花费的时间太长 return。我们遵循书中的每条规则来分片数据,通过使用聚合和分区等优化多维数据集的设计,但我们的一些非重复计数查询仍然需要 1-2 分钟 :( 我们事实的数据大小 table 大约250GB左右。并且有10-12个维度以星型模式连接。

因此我们决定试用 Hadoop/HBase/NoSQL dbs 等开源技术,看看它们是否可以通过最少的设置和入门来解决我们的 OLAP 场景。

我们对新技术的主要要求是

  1. 对于非重复计数查询(< 2 秒),它必须获得极快或即时的结果

  2. 支持度量和维度的概念(类似于 OLAP)。

  3. 支持 SQL 类查询语言,因为我们的许多开发人员都是 SQL 专家。
  4. 能够连接 Excel/Tableau 以可视化数据。

由于当今开源世界中有如此多的新技术和工具,我希望您能帮我指出正确的方向。

看来 "Kylin" http://www.kylin.io/ 是我的答案。这具有我想要的所有要求,甚至更多。我现在要试试看! :)

备注:我来自 Apache Kylin 团队。

请参考以下答案,可能会给您带来一些启发:

我们对新技术的主要要求是 对于非重复计数查询(< 2 秒)

,它必须获得极快或即时的结果

--Luke:90% 的 tile 查询延迟小于 5s 是我们目前的统计数据。对于 <2s on distinct count,您将拥有多少数据?大概结果可以吗?

支持度量和维度的概念(类似于 OLAP)。

--Luke:Kylin 是纯 OLAP 引擎,具有维度(也支持层次结构)和度量(Sum/Count/Min/Max/Avg/DistinctCount)定义

支持 SQL 类查询语言,因为我们的许多开发人员都是 SQL 专家。 --Luke: Kylin 支持 ANSI SQL 接口(大多数 SELECT 功能)

能够连接 Excel/Tableau 以可视化数据。

--Luke: Kylin 的 ODBC Driver 与 Tableau 配合得很好,Excel/PowerBI 即将推出。

如果您有更多问题,请告诉我们。

谢谢。