与 CQL 相比，Spark 有哪些额外优势？

What additional benefits does Spark give over CQL?

我们正在探索 Cassandra 的 SPARK，以克服 CQL 的局限性。

我们最初仅限于 CQL，但在 RDBMS 上几乎没有道路 blocks/hurdles。举几个例子如下

我是 cassandra 的新手，由于限制，我经常重新访问我的架构。

因此与 HDFS 的 HIVE/PIG 类似，Spark 比 CQL 有哪些额外优势？

CQL 不能替代 SQL。它实际上是为从几个（通常是一个）分区键中提取值而设计的，正如您所指出的，它不会进行任何类型的聚合、分组、非常有限的排序等（尽管 Cassandra 3.0 将具有 UDF 和 UDA） .

以下是 Spark 通过 CQL 提供的功能：

Spark 确实是与 CQL 完全不同的野兽。它提供对大量数据的复杂分析，而 CQL 则没有。但是，也有一些限制：

如果您希望通过支持更新且无需缓存的 Cassandra 进行非常快速的分析查询，请查看我的项目 http://github.com/tuplejump/FiloDB。