Neo4J - 存储到关系与节点

Neo4J - Storing into relationship vs nodes

我想知道将数据存储到关系或节点中是否有任何优点或缺点。

例如,如果我要将与讨论相关的评论存储到数据库中,我应该将评论数据存储在与讨论相关的 "comment" 关系还是 "comment" 节点中通过单独的关系。

正确的数据模型取决于您需要进行的查询类型。您应该弄清楚您的查询是什么,然后确定满足这些条件的数据模型:

  1. 它可以让你回答你所有的问题,
  2. 它可以让您的查询足够快地完成,
  3. 它最大限度地减少了所需的数据库存储空间。

在讨论评论的情况下,您可能想要查询按时间顺序排列的讨论线程。因此,您不仅需要存储发表评论的时间,还需要存储评论之间的关系(因为讨论会产生不相交的线程,这些线程不共享相同的先前评论)。

让我们尝试一个简单的测试用例。假设相同的初始评论(我们称之为 c1)产生了 2 个不相交的线程:[c1, c3] 和 [c1, c2, c4]。并假设,在这个简单的测试用例中,我们只对查询与主题相关的所有评论线程感兴趣。

如果评论属性存储在节点中,数据可能如下所示:

(u1:User {name: "A"})-[:MADE]->(c1:Comment {time:0, text: "Fee"})-[:ABOUT]->(s1:Subject {title: "Jack"})
(u2:User {name: "B"})-[:MADE]->(c2:Comment {time:1, text: "Fie"})-[:ABOUT]->(c1)
(u3:User {name: "C"})-[:MADE]->(c3:Comment {time:3, text: "Foe"})-[:ABOUT]->(c1)
(u4:User {name: "D"})-[:MADE]->(c4:Comment {time:9, text: "Fum"})-[:ABOUT]->(c2)

如果您改为将评论属性存储在关系中,您可以尝试类似以下的操作,但存在一个大缺陷。一个关系无法直接指向另一个关系(正如我们在第 2 到 4 行中尝试做的那样)。由于此模型在 neo4j 中不合法,因此不符合上述任何条件。

(u1:User {name: "A"})-[c1:COMMENTED_ABOUT {time:0, text: "Fee"}]->(s1:Subject {title: "Jack"})
(u2:User {name: "B"})-[c2:COMMENTED_ABOUT {time:1, text: "Fie"}]->(c1)
(u3:User {name: "C"})-[c3:COMMENTED_ABOUT {time:3, text: "Foe"}]->(c1)
(u4:User {name: "D"})-[c4:COMMENTED_ABOUT {time:9, text: "Fum"}]->(c2)

因此,在我们简单的测试用例中,将属性存储在节点中似乎是唯一的选择。

这是一个查询,用于获取不相交的线程路径,包括发表每条评论的用户(WHERE 子句过滤掉部分线程):

MATCH p=(s:Subject)<-[:ABOUT*]-(c:Comment)<-[m:MADE]-(u:User)
WHERE NOT (c)<-[:ABOUT]-()
RETURN p