将列表拆分为不均匀的元组

Splitting a list into uneven tuples

我正在尝试将一个字符串列表拆分为一个包含这些字符串的长度不均匀的元组列表,每个元组都包含最初用空白字符串分隔的字符串。基本上我需要可以应用于列表的参数化拆分。如果我的初始列表如下所示:

init = ['a', 'b', '', 'c', 'd e', 'fgh', '', 'ij', '', '', 'k', 'l', '']

此列表的最后一个元素始终是结束符 ''。可以有连续的'',视为单项。 我需要的结果是:

end = [('a', 'b'), ('c', 'd e', 'fgh'), ('ij',), ('k', 'l')]

我已经有丑陋的代码来完成工作,一旦列表完全弹出就超出范围:

end = []
while init[-1] == u'':
 init.pop()
 l = []
 while init[-1] != u'':
  l.append(init.pop())
 end.append(tuple(l))

我想使用推导式,但尝试解包参数列表、反转自引用列表、使用 deque 队列和各种代码味道都没有成功,我现在怀疑它是否有意义对于(嵌套的)理解解决方案?

您可以使用 itertools.groupby 函数根据元素的大小对元素进行分组,如下所示

>>> from itertools import groupby
>>> init = ['a', 'b', '', 'c', 'd e', 'fgh', '', 'ij', '', '', 'k', 'l', '']
>>> [tuple(g) for valid, g in groupby(init, key=lambda x: len(x) != 0) if valid]
[('a', 'b'), ('c', 'd e', 'fgh'), ('ij',), ('k', 'l')]

这基本上是根据元素的长度对元素进行分组。如果项目的长度不等于零,它们将被放在一个组中,直到遇到来自另一个组的元素。对于长度不为零的元素组,key 函数将 return True,否则 False。我们忽略带有 False 的组(因此检查 if valid)。

如果您想使用特殊分隔符拆分列表,groupby 是一种更简洁和通用的方法:

>>> delimiter = ''
>>> [tuple(g) for k, g in groupby(init, delimiter.__eq__) if not k]
[('a', 'b'), ('c', 'd e', 'fgh'), ('ij',), ('k', 'l')]