如何 运行 增量查询

How to run an incremental query

我正在使用 Cassandra 3.10 和 DataStax 3.1.4。 我希望能够 运行 一个以 10000 条记录为一组返回数据的查询,直到处理完整个数据集,目的是提高内存效率

如果您事先知道数据集的大小(例如 10k 条记录),您可以做的最好的事情就是围绕此数据集大小设计 tables,例如创建一个 table 并组织 a priori 将您的数据分成每个 10k 条记录的分区。

这基本上是为了匹配规则"model around your queries"。

您可以在大多数驱动程序中分页数据。因此,对于您的查询,您将指定一个 fetchsize。当您到达结果集中最后提取的行时,驱动程序将自动提取下一个 fetchsize 行数。

您需要了解的关于 datastax java 驱动寻呼机的一切都在此处有详细记录:https://docs.datastax.com/en/developer/java-driver/2.1/manual/paging/