Python 中有许多循环的复杂列表理解

Question

我目前正在做一些理解列表，在增加其中的循环数量时遇到了一个问题。到目前为止我的代码如下：

selected_sheet_names = []
selected_sheet_names.append([x for x in sheet_names if x.endswith("b1")])
selected_sheet_names.append([x for x in sheet_names if x.endswith("b2")])
selected_sheet_names.append([x for x in sheet_names if x.endswith("b3")])

sheet_names 列表包含不同的字符串，所有字符串都以 b1、b2 或 b3 结尾。如果你想在你的代码中检查它们：

sheet_names = ['0.5C_1_b1', '0.5C_2_b1', '1C_1_b1', '1C_2_b1', '1C_3_b1', '1C_4_b1', '1C_5_b1', 
'0.11C_1_b2', '0.57C_1_b2', '1.14C_1_b2', '1.14C_2_b2', '1.14C_3_b2', '1.14C_4_b2', '1.14C_5_b2', 
'1.14C_6_b2', '1.14C_7_b2', '1.14C_8_b2', '1C_1_b3', '1C_2_b3', '1C_3_b3', '1C_4_b3', '1C_5_b3', 
'1C_6_b3', '1C_7_b3', '1C_8_b3']

如果我想 print(selected_sheet_names) 结果如下：

[
    ['0.5C_1_b1', '0.5C_2_b1', '1C_1_b1', '1C_2_b1', '1C_3_b1', '1C_4_b1', '1C_5_b1'], 
    ['0.11C_1_b2', '0.57C_1_b2', '1.14C_1_b2', '1.14C_2_b2', '1.14C_3_b2', '1.14C_4_b2', '1.14C_5_b2', '1.14C_6_b2', '1.14C_7_b2', '1.14C_8_b2'], 
    ['1C_1_b3', '1C_2_b3', '1C_3_b3', '1C_4_b3', '1C_5_b3', '1C_6_b3', '1C_7_b3', '1C_8_b3']
]

完全符合我的预期，但如果我想在第一个代码块中有更多 x.endswith(some_string)，代码就会变得太大，因此，我认为我应该尝试更改 selected_sheet_names.append([x for x in sheet_names if x.endswith(some_string)]) 对其他一些更复杂的列表理解重复多次，可以迭代 some_list 并执行相同的操作。

some_list = ["b1", "b2", "b3" ... ]

有人可以给我一些建议吗？

编辑 1：我知道我可以用 for 循环来实现它，但在这个例子中，如果可能的话，我对理解实现列表特别感兴趣。 for循环可以如下：

selected_sheet_names = []
for ending in some_list:
    selected_sheet_names.append([x for x in sheet_names if x.endswith(ending)])

编辑 2（感谢 Pedro Maia）：

如果数据是连续的（但我的情况不是这样），您可以使用：

from itertools import groupby

selected_sheet_names = [list(l[1]) for l in groupby(sheet_names, lambda x: x[-2:])]

抱歉，我向您展示了一个连续的列表。如果您的数据不连续，输出可能如下所示：

[
    ['0.11C_1_b2'], 
    ['0.5C_1_b1'], 
    ['0.57C_1_b2'], 
    ['0.5C_2_b1', '1C_1_b1', '1C_2_b1', '1C_3_b1', '1C_4_b1', '1C_5_b1'], 
    ['1.14C_1_b2', '1.14C_2_b2', '1.14C_3_b2', '1.14C_4_b2', '1.14C_5_b2', '1.14C_6_b2', '1.14C_7_b2', '1.14C_8_b2'], 
    ['1C_1_b3', '1C_2_b3', '1C_3_b3', '1C_4_b3', '1C_5_b3', '1C_6_b3', '1C_7_b3', '1C_8_b3']
]

但是，如果你的数据是连续的，这个方法似乎更好

谢谢大家的回复！

Answer 1

与您建议的形式匹配的简单嵌套 listcomp 将遍历匿名 tuple 字符串以检查：

selected_sheet_names = [[x for x in sheet_names if x.endswith(some_string)]
                        for some_string in ("b1", "b2", "b3")]

如果您从其他地方获得 some_list，或者定义内联的时间太长，您可以将匿名 tuple 替换为 some_list（如果已经定义）。

Answer 2

或者，您可以使用内置 itertools 模块中的 groupby：

from itertools import groupby

selected_sheet_names = [list(l[1]) for l in groupby(sheet_names, lambda x: x[-2:])]

它提供了更简洁、性能更好的代码，因为您不会重复多次不必要的次数

Python 中有许多循环的复杂列表理解

Complicated list comprehension with many loop in Python

python

lambda

list-comprehension