如何运行增量查询

How to run an incremental query

我正在使用 Cassandra 3.10 和 DataStax 3.1.4。我希望能够运行一个以 10000 条记录为一组返回数据的查询，直到处理完整个数据集，目的是提高内存效率

如果您事先知道数据集的大小（例如 10k 条记录），您可以做的最好的事情就是围绕此数据集大小设计 tables，例如创建一个 table 并组织 a priori 将您的数据分成每个 10k 条记录的分区。

这基本上是为了匹配规则"model around your queries"。

您可以在大多数驱动程序中分页数据。因此，对于您的查询，您将指定一个 fetchsize。当您到达结果集中最后提取的行时，驱动程序将自动提取下一个 fetchsize 行数。

您需要了解的关于 datastax java 驱动寻呼机的一切都在此处有详细记录：https://docs.datastax.com/en/developer/java-driver/2.1/manual/paging/