在 gremlin 中查找重复项

find duplicates in gremlin

我在 AWS Neptune GraphDB 上有数据。其中的每条记录都有具有唯一值的 KeyId(属性)。一些数据重复了,这可以通过 KeyId(属性) 和 groupCount() 步骤找到。我的问题是,我可以使用 groupCount() 过滤多个值吗?或者任何其他通过键查找重复项的最佳方法。

gremlin> g.V().has('keyId').groupCount().by('keyId')
==> [HJ001:2, HJ002:1,HJ003:1,HJ004:2,HJ005:3]

我只需要 groupCount > 1 的结果。(但不是 count=1) 谁能帮我解决这个问题。

如果您按如下方式添加到您的查询中,这应该可以满足您的要求。

g.V().has('keyId').groupCount().by('keyId').
      unfold().where(select(values).is(gt(1)))

干杯 开尔文