Python:同时具有多个键值对的字典理解
Python: dict comprehension with multiple key-value pairs in the same time
目标:表达的工作模拟
{k1: v1, k2: v2 for k1, k2, v1, v2 in data}
或更多特殊情况{k1: v, k2: v for k1, k2, v, _ in data}
仅 data
迭代 1 次(在给定的示例中,data
是 4 元组的可迭代对象)。
(以及关于列表理解的类似问题,例如 [myfunc1(v1), myfunc2(v2) for v1, v2 in data]
)。
我只能假设使用自己的迭代器的解决方案:
def getby(iterable_data, iterable_indexes):
for indexed_data in iterable_data:
for tupl in iterable_indexes:
yield tuple(indexed_data[ind] for ind in tupl)
raise StopIteration
工作示例:list(getby([('a', 'b', 'c'), ('d', 'e', 'f', 'g')], [(0, 1), (2, 1)]))
returns [('a', 'b'), ('c', 'b'), ('d', 'e'), ('f', 'e')]
。
但可能它很慢。
我也可以假设上面例子中 itertools.chain
和 itertools.groupby
的等效表达式:
list(chain.from_iterable(lst for lst, _ in groupby([('a', 'b', 'c'), ('d', 'e', 'f', 'g')],
lambda lst: [(lst[0], lst[1]), (lst[2], lst[1])])))
但也有可能是丑的
基于 ipython 的两个解决方案的比较:第一个 1000 个循环,最好的 3 个:每个循环 20.2 ms ,第二个 1000 循环,最好的 3:每个循环 4.12 ms,所以第二个解决方案确实更快。但也许存在更优雅的解决方案?
理解格式严格限制为每次迭代 一个 个结果。不过,您可以添加额外的循环,以遍历要插入的多个元素:
{k: v for k1, k2, v1, v2 in data for k, v in ((k1, v1), (k2, v2))}
或者你的第二个例子:
{k: v for k1, k2, v, _ in data for k in (k1, k2)}
相当于:
result = {}
for k1, k2, v1, v2 in data:
for k in (k1, k2):
result[k] = v
如果您可以将某些东西写成嵌套循环,中间可能有 if
语句,最内层只有 一个 语句分配一个键值pair,那么你可以用字典理解来表达它。
您也可以使用 chain.from_iterable()
执行此操作,但随后会生成具有键值对序列的列表或元组,并将结果传递给 dict()
函数:
dict(chain.from_iterable(((k1, v1), (k2, v2)) for k1, v1, k2, v2 in data))
dict(chain.from_iterable(((k1, v), (k2, v)) for k1, k2, v, _ in data))
目标:表达的工作模拟
{k1: v1, k2: v2 for k1, k2, v1, v2 in data}
或更多特殊情况{k1: v, k2: v for k1, k2, v, _ in data}
仅 data
迭代 1 次(在给定的示例中,data
是 4 元组的可迭代对象)。
(以及关于列表理解的类似问题,例如 [myfunc1(v1), myfunc2(v2) for v1, v2 in data]
)。
我只能假设使用自己的迭代器的解决方案:
def getby(iterable_data, iterable_indexes):
for indexed_data in iterable_data:
for tupl in iterable_indexes:
yield tuple(indexed_data[ind] for ind in tupl)
raise StopIteration
工作示例:list(getby([('a', 'b', 'c'), ('d', 'e', 'f', 'g')], [(0, 1), (2, 1)]))
returns [('a', 'b'), ('c', 'b'), ('d', 'e'), ('f', 'e')]
。
但可能它很慢。
我也可以假设上面例子中 itertools.chain
和 itertools.groupby
的等效表达式:
list(chain.from_iterable(lst for lst, _ in groupby([('a', 'b', 'c'), ('d', 'e', 'f', 'g')],
lambda lst: [(lst[0], lst[1]), (lst[2], lst[1])])))
但也有可能是丑的
基于ipython 的两个解决方案的比较:第一个 1000 个循环,最好的 3 个:每个循环 20.2 ms ,第二个 1000 循环,最好的 3:每个循环 4.12 ms,所以第二个解决方案确实更快。但也许存在更优雅的解决方案?
理解格式严格限制为每次迭代 一个 个结果。不过,您可以添加额外的循环,以遍历要插入的多个元素:
{k: v for k1, k2, v1, v2 in data for k, v in ((k1, v1), (k2, v2))}
或者你的第二个例子:
{k: v for k1, k2, v, _ in data for k in (k1, k2)}
相当于:
result = {}
for k1, k2, v1, v2 in data:
for k in (k1, k2):
result[k] = v
如果您可以将某些东西写成嵌套循环,中间可能有 if
语句,最内层只有 一个 语句分配一个键值pair,那么你可以用字典理解来表达它。
您也可以使用 chain.from_iterable()
执行此操作,但随后会生成具有键值对序列的列表或元组,并将结果传递给 dict()
函数:
dict(chain.from_iterable(((k1, v1), (k2, v2)) for k1, v1, k2, v2 in data))
dict(chain.from_iterable(((k1, v), (k2, v)) for k1, k2, v, _ in data))