在 gremlin 中查找重复项

Question

我在 AWS Neptune GraphDB 上有数据。其中的每条记录都有具有唯一值的 KeyId(属性)。一些数据重复了，这可以通过 KeyId(属性) 和 groupCount() 步骤找到。我的问题是，我可以使用 groupCount() 过滤多个值吗？或者任何其他通过键查找重复项的最佳方法。

gremlin> g.V().has('keyId').groupCount().by('keyId')
==> [HJ001:2, HJ002:1,HJ003:1,HJ004:2,HJ005:3]

我只需要 groupCount > 1 的结果。（但不是 count=1）谁能帮我解决这个问题。

Answer 1

如果您按如下方式添加到您的查询中，这应该可以满足您的要求。

g.V().has('keyId').groupCount().by('keyId').
      unfold().where(select(values).is(gt(1)))

干杯开尔文

在 gremlin 中查找重复项

find duplicates in gremlin

gremlin

amazon-neptune