使用 +-运算符连接 python 3 中的生成器

Concatenate generators in python 3 with +-operator

我想知道为什么 + 运算符没有为生成器实现。这里 Concatenate generator and item 建议 itertools.chain 的解决方案,不过我认为 + 语法与连接列表时的语法一样可读。

gen1 = (x for x in [1,2,3])
gen2 = (x for x in [4,5,6])

# Works:
from itertools import chain
print(' '.join(map(str, chain(gen1, gen2))))

# TypeError: unsupported operand type(s) for +: 'generator' and 'generator'
print(' '.join(map(str, gen1 + gen2)))

+ 不可用于生成器是否有(哲学上的)原因?我认为它会使代码更具可读性 interator.chain(...)gen1+gen2有没有什么歧义?

来自 Python 邮件列表:

https://mail.python.org/pipermail/python-ideas/2010-April/006982.html

On Sun, Apr 4, 2010 at 9:58 AM, cool-RR wrote:

I'm still a bit confused by generators and generator expressions, but what about making a generator.__add__ method, that'll act like itertools.chain?

每年都会多次提出这个建议。我们总是把它击落 同样的原因:迭代器是一个抽象的 API 而我们不想 负担每个迭代器实现的负担,必须实现各种 操作。

-- --Guido van Rossum (python.org/~guido)

对于数字、字符串和序列的 __add__ 当前实现,方法 return 是一个独立于操作数的新对象。即

x = [1]
y = [2]
z = x + y
x.append(1)
assert z == [1, 2] # z is not effected by the mutation of x

然而,生成器都是可变的(重复调用next不一定return相同的值),更重要的是惰性。也就是说,由 __add__ 编辑的生成器对象 return 仍然本质上链接到操作数。例如

x = iter(range(3))
y = iter(range(3, 6))
z = x + y
a = list(x)
b = list(z) # what should the contents of z be?

根据 __add__ 当前语义的约定,内容应为 [0, 1, 2, 3, 4, 5]。但是,由于生成器不是独立的,因此结果将为 [3, 4, 5]。代码示例如下:

import itertools

class ExtendedGenerator:

    def __init__(self, gen):
        self.gen = iter(gen)

    def __iter__(self):
        return self

    def __next__(self):
        return next(self.gen)

    def __add__(self, other):
        try:
            return ExtendedGenerator(itertools.chain(self.gen, iter(other)))
        except TypeError:
            return NotImplemented

    def __radd__(self, other):
        try:
            return ExtendedGenerator(itertools.chain(iter(other), self.gen))
        except TypeError:
            return NotImplemented

x = ExtendedGenerator(range(3))
y = range(3, 6)
z = x + y
a = list(x)
b = list(z) # what should the contents of z be?

print("a:", a)
print("b:", b)

打印:

a: [0, 1, 2]
b: [3, 4, 5]