Python 中有许多循环的复杂列表理解

Complicated list comprehension with many loop in Python

我目前正在做一些理解列表,在增加其中的循环数量时遇到了一个问题。到目前为止我的代码如下:

selected_sheet_names = []
selected_sheet_names.append([x for x in sheet_names if x.endswith("b1")])
selected_sheet_names.append([x for x in sheet_names if x.endswith("b2")])
selected_sheet_names.append([x for x in sheet_names if x.endswith("b3")])

sheet_names 列表包含不同的字符串,所有字符串都以 b1b2b3 结尾。如果你想在你的代码中检查它们:

sheet_names = ['0.5C_1_b1', '0.5C_2_b1', '1C_1_b1', '1C_2_b1', '1C_3_b1', '1C_4_b1', '1C_5_b1', 
'0.11C_1_b2', '0.57C_1_b2', '1.14C_1_b2', '1.14C_2_b2', '1.14C_3_b2', '1.14C_4_b2', '1.14C_5_b2', 
'1.14C_6_b2', '1.14C_7_b2', '1.14C_8_b2', '1C_1_b3', '1C_2_b3', '1C_3_b3', '1C_4_b3', '1C_5_b3', 
'1C_6_b3', '1C_7_b3', '1C_8_b3']

如果我想 print(selected_sheet_names) 结果如下:

[
    ['0.5C_1_b1', '0.5C_2_b1', '1C_1_b1', '1C_2_b1', '1C_3_b1', '1C_4_b1', '1C_5_b1'], 
    ['0.11C_1_b2', '0.57C_1_b2', '1.14C_1_b2', '1.14C_2_b2', '1.14C_3_b2', '1.14C_4_b2', '1.14C_5_b2', '1.14C_6_b2', '1.14C_7_b2', '1.14C_8_b2'], 
    ['1C_1_b3', '1C_2_b3', '1C_3_b3', '1C_4_b3', '1C_5_b3', '1C_6_b3', '1C_7_b3', '1C_8_b3']
]

完全符合我的预期,但如果我想在第一个代码块中有更多 x.endswith(some_string),代码就会变得太大,因此,我认为我应该尝试更改 selected_sheet_names.append([x for x in sheet_names if x.endswith(some_string)]) 对其他一些更复杂的列表理解重复多次,可以迭代 some_list 并执行相同的操作。

some_list = ["b1", "b2", "b3" ... ]

有人可以给我一些建议吗?

编辑 1: 我知道我可以用 for 循环来实现它,但在这个例子中,如果可能的话,我对理解实现列表特别感兴趣。 for循环可以如下:

selected_sheet_names = []
for ending in some_list:
    selected_sheet_names.append([x for x in sheet_names if x.endswith(ending)])

编辑 2(感谢 Pedro Maia):

如果数据是连续的(但我的情况不是这样),您可以使用:

from itertools import groupby

selected_sheet_names = [list(l[1]) for l in groupby(sheet_names, lambda x: x[-2:])]

抱歉,我向您展示了一个连续的列表。如果您的数据不连续,输出可能如下所示:

[
    ['0.11C_1_b2'], 
    ['0.5C_1_b1'], 
    ['0.57C_1_b2'], 
    ['0.5C_2_b1', '1C_1_b1', '1C_2_b1', '1C_3_b1', '1C_4_b1', '1C_5_b1'], 
    ['1.14C_1_b2', '1.14C_2_b2', '1.14C_3_b2', '1.14C_4_b2', '1.14C_5_b2', '1.14C_6_b2', '1.14C_7_b2', '1.14C_8_b2'], 
    ['1C_1_b3', '1C_2_b3', '1C_3_b3', '1C_4_b3', '1C_5_b3', '1C_6_b3', '1C_7_b3', '1C_8_b3']
]

但是,如果你的数据是连续的,这个方法似乎更好

谢谢大家的回复!

与您建议的形式匹配的简单嵌套 listcomp 将遍历匿名 tuple 字符串以检查:

selected_sheet_names = [[x for x in sheet_names if x.endswith(some_string)]
                        for some_string in ("b1", "b2", "b3")]

如果您从其他地方获得 some_list,或者定义内联的时间太长,您可以将匿名 tuple 替换为 some_list(如果已经定义)。

或者,您可以使用内置 itertools 模块中的 groupby

from itertools import groupby

selected_sheet_names = [list(l[1]) for l in groupby(sheet_names, lambda x: x[-2:])]

它提供了更简洁、性能更好的代码,因为您不会重复多次不必要的次数