Neo4j

Question

我目前正在尝试使用官方 Bolt 驱动程序将大量数据读入我的 Java 应用程序。我遇到问题是因为图表相当大（~17k 节点，~500k 关系），当然我想分块阅读以提高内存效率。我想要得到的是源节点和目标节点之间的字段混合，以及关系本身。我尝试写一个分页查询：

MATCH (n:NodeLabel)-[r:RelationshipLabel]->(n:NodeLabel) 
WITH r.some_date AS some_date, r.arrival_times AS arrival_times,
     r.departure_times AS departure_times, r.path_ids AS path_ids,
     n.node_id AS origin_node_id, m.node_id AS dest_node_id
ORDER BY id(r)
RETURN some_date, arrival_times, departure_times, path_ids,
       origin_node_id, dest_node_id 
LIMIT 5000

（我更改了一些标签和字段命名，因此查询的目的并不明显）

我的想法是在后续查询中使用 SKIP 来读取更多数据。然而，在 5000 rows/read 时，每次读取大约需要 7 秒，大概是因为全扫描 ORDER BY 强制，如果我 SKIP 它会显着增加执行时间和内存使用量。阅读整个内容太长了，有什么办法可以加快查询速度吗？或者将结果分块流式传输到我的应用程序中？一般来说，读取大量数据的最佳方法是什么？

提前致谢。

Answer 1

而不是 skip。从第二次调用开始，您可以执行 id(r) > "last received id(r)" 它实际上应该减少处理时间。

Neo4j - 使用 Java 读取大量数据

Neo4j - Reading large amounts of data with Java

java

cypher

bolt