在 gremlin 中查找重复项
find duplicates in gremlin
我在 AWS Neptune GraphDB 上有数据。其中的每条记录都有具有唯一值的 KeyId(属性)。一些数据重复了,这可以通过 KeyId(属性) 和 groupCount() 步骤找到。我的问题是,我可以使用 groupCount() 过滤多个值吗?或者任何其他通过键查找重复项的最佳方法。
gremlin> g.V().has('keyId').groupCount().by('keyId')
==> [HJ001:2, HJ002:1,HJ003:1,HJ004:2,HJ005:3]
我只需要 groupCount > 1 的结果。(但不是 count=1)
谁能帮我解决这个问题。
如果您按如下方式添加到您的查询中,这应该可以满足您的要求。
g.V().has('keyId').groupCount().by('keyId').
unfold().where(select(values).is(gt(1)))
干杯
开尔文
我在 AWS Neptune GraphDB 上有数据。其中的每条记录都有具有唯一值的 KeyId(属性)。一些数据重复了,这可以通过 KeyId(属性) 和 groupCount() 步骤找到。我的问题是,我可以使用 groupCount() 过滤多个值吗?或者任何其他通过键查找重复项的最佳方法。
gremlin> g.V().has('keyId').groupCount().by('keyId')
==> [HJ001:2, HJ002:1,HJ003:1,HJ004:2,HJ005:3]
我只需要 groupCount > 1 的结果。(但不是 count=1) 谁能帮我解决这个问题。
如果您按如下方式添加到您的查询中,这应该可以满足您的要求。
g.V().has('keyId').groupCount().by('keyId').
unfold().where(select(values).is(gt(1)))
干杯 开尔文