查找数字子集的分组

Find groupings of numeric subsets

假设我有这些数字集

a = {1, 2, 3}
b = {2, 3, 4}
c = {1, 5}

我想找到集合的所有不同的数字分组。结果将是

{1}, {2, 3}, {4}, {5}

我的幼稚方法是这样的,但行不通:

data = [{1, 2, 3}, {2, 3, 4}, {1, 5}]
for i in range(1, 5):
    s = set.intersection(*[x for x in data if i in x])
    print(s)

哪个returns

set([1])
set([2, 3])
set([2, 3])
set([2, 3, 4])

可以很容易地删除重复数据,但没有给出预期的结果。

我怎样才能只得到集合子集中存在的数字分组?

您的代码有两个问题:

  • 您在 5 停了下来,但 range 不包括停靠点,因此您不检查 5。
  • 如果一个值只在一个集合中,您需要创建一个只包含该值的集合。至少您的预期结果看起来像是所需的行为。

因此,通过解决这些问题,代码将如下所示:

data = [{1, 2, 3}, {2, 3, 4}, {1, 5}]
for i in range(1, 6):
    useful_sets = [x for x in data if i in x]
    if len(useful_sets) <= 1:
        print(set([i]))
    else:
        s = set.intersection(*useful_sets)
        print(s)

# prints:
# {1}
# {2, 3}
# {2, 3}
# {4}
# {5}

要获得完整(而不是重复)的结果,您可以将它们存储为一组中的冻结集:

data = [{1, 2, 3}, {2, 3, 4}, {1, 5}]
res = set()
for i in range(1, 6):
    useful_sets = [x for x in data if i in x]
    if len(useful_sets) <= 1:
        res.add(frozenset([i]))
    else:
        s = set.intersection(*useful_sets)
        res.add(frozenset(s))

print(res)
# {frozenset({5}), frozenset({4}), frozenset({2, 3}), frozenset({1})}

哪个(顺序除外)应该正是您想要的。