使用 +-运算符连接 python 3 中的生成器
Concatenate generators in python 3 with +-operator
我想知道为什么 +
运算符没有为生成器实现。这里 Concatenate generator and item 建议 itertools.chain 的解决方案,不过我认为 +
语法与连接列表时的语法一样可读。
gen1 = (x for x in [1,2,3])
gen2 = (x for x in [4,5,6])
# Works:
from itertools import chain
print(' '.join(map(str, chain(gen1, gen2))))
# TypeError: unsupported operand type(s) for +: 'generator' and 'generator'
print(' '.join(map(str, gen1 + gen2)))
+
不可用于生成器是否有(哲学上的)原因?我认为它会使代码更具可读性 interator.chain(...)
。 gen1+gen2
有没有什么歧义?
来自 Python 邮件列表:
https://mail.python.org/pipermail/python-ideas/2010-April/006982.html
On Sun, Apr 4, 2010 at 9:58 AM, cool-RR wrote:
I'm still a bit confused by generators and generator expressions, but what
about making a generator.__add__
method, that'll act like
itertools.chain
?
每年都会多次提出这个建议。我们总是把它击落
同样的原因:迭代器是一个抽象的 API 而我们不想
负担每个迭代器实现的负担,必须实现各种
操作。
--
--Guido van Rossum (python.org/~guido)
对于数字、字符串和序列的 __add__
当前实现,方法 return 是一个独立于操作数的新对象。即
x = [1]
y = [2]
z = x + y
x.append(1)
assert z == [1, 2] # z is not effected by the mutation of x
然而,生成器都是可变的(重复调用next
不一定return相同的值),更重要的是惰性。也就是说,由 __add__
编辑的生成器对象 return 仍然本质上链接到操作数。例如
x = iter(range(3))
y = iter(range(3, 6))
z = x + y
a = list(x)
b = list(z) # what should the contents of z be?
根据 __add__
当前语义的约定,内容应为 [0, 1, 2, 3, 4, 5]
。但是,由于生成器不是独立的,因此结果将为 [3, 4, 5]
。代码示例如下:
import itertools
class ExtendedGenerator:
def __init__(self, gen):
self.gen = iter(gen)
def __iter__(self):
return self
def __next__(self):
return next(self.gen)
def __add__(self, other):
try:
return ExtendedGenerator(itertools.chain(self.gen, iter(other)))
except TypeError:
return NotImplemented
def __radd__(self, other):
try:
return ExtendedGenerator(itertools.chain(iter(other), self.gen))
except TypeError:
return NotImplemented
x = ExtendedGenerator(range(3))
y = range(3, 6)
z = x + y
a = list(x)
b = list(z) # what should the contents of z be?
print("a:", a)
print("b:", b)
打印:
a: [0, 1, 2]
b: [3, 4, 5]
我想知道为什么 +
运算符没有为生成器实现。这里 Concatenate generator and item 建议 itertools.chain 的解决方案,不过我认为 +
语法与连接列表时的语法一样可读。
gen1 = (x for x in [1,2,3])
gen2 = (x for x in [4,5,6])
# Works:
from itertools import chain
print(' '.join(map(str, chain(gen1, gen2))))
# TypeError: unsupported operand type(s) for +: 'generator' and 'generator'
print(' '.join(map(str, gen1 + gen2)))
+
不可用于生成器是否有(哲学上的)原因?我认为它会使代码更具可读性 interator.chain(...)
。 gen1+gen2
有没有什么歧义?
来自 Python 邮件列表:
https://mail.python.org/pipermail/python-ideas/2010-April/006982.html
On Sun, Apr 4, 2010 at 9:58 AM, cool-RR wrote:
I'm still a bit confused by generators and generator expressions, but what about making a
generator.__add__
method, that'll act likeitertools.chain
?每年都会多次提出这个建议。我们总是把它击落 同样的原因:迭代器是一个抽象的 API 而我们不想 负担每个迭代器实现的负担,必须实现各种 操作。
-- --Guido van Rossum (python.org/~guido)
对于数字、字符串和序列的 __add__
当前实现,方法 return 是一个独立于操作数的新对象。即
x = [1]
y = [2]
z = x + y
x.append(1)
assert z == [1, 2] # z is not effected by the mutation of x
然而,生成器都是可变的(重复调用next
不一定return相同的值),更重要的是惰性。也就是说,由 __add__
编辑的生成器对象 return 仍然本质上链接到操作数。例如
x = iter(range(3))
y = iter(range(3, 6))
z = x + y
a = list(x)
b = list(z) # what should the contents of z be?
根据 __add__
当前语义的约定,内容应为 [0, 1, 2, 3, 4, 5]
。但是,由于生成器不是独立的,因此结果将为 [3, 4, 5]
。代码示例如下:
import itertools
class ExtendedGenerator:
def __init__(self, gen):
self.gen = iter(gen)
def __iter__(self):
return self
def __next__(self):
return next(self.gen)
def __add__(self, other):
try:
return ExtendedGenerator(itertools.chain(self.gen, iter(other)))
except TypeError:
return NotImplemented
def __radd__(self, other):
try:
return ExtendedGenerator(itertools.chain(iter(other), self.gen))
except TypeError:
return NotImplemented
x = ExtendedGenerator(range(3))
y = range(3, 6)
z = x + y
a = list(x)
b = list(z) # what should the contents of z be?
print("a:", a)
print("b:", b)
打印:
a: [0, 1, 2]
b: [3, 4, 5]