为什么列表理解比附加到列表快得多?
Why is a list comprehension so much faster than appending to a list?
我想知道为什么列表理解比附加到列表快得多。我以为区别只是表现力,其实不是。
>>> import timeit
>>> timeit.timeit(stmt='''\
t = []
for i in range(10000):
t.append(i)''', number=10000)
9.467898777974142
>>> timeit.timeit(stmt='t= [i for i in range(10000)]', number=10000)
4.1138417314859
列表理解速度提高了 50%。为什么?
列表理解 基本上只是常规 for
循环的“语法糖”。在这种情况下,它表现更好的原因是因为它不需要加载列表的 append 属性并将其作为函数在每次迭代中调用。换句话说,一般来说,列表理解执行得更快,因为暂停和恢复一个函数的框架,或者在其他情况下的多个函数,比按需创建列表要慢。
考虑以下示例:
In [1]: def f1():
...: l = []
...: for i in range(5):
...: l.append(i)
...:
...:
...: def f2():
...: [i for i in range(5)]
...:
In [3]: import dis
In [4]: dis.dis(f1)
2 0 BUILD_LIST 0
2 STORE_FAST 0 (l)
3 4 LOAD_GLOBAL 0 (range)
6 LOAD_CONST 1 (5)
8 CALL_FUNCTION 1
10 GET_ITER
>> 12 FOR_ITER 14 (to 28)
14 STORE_FAST 1 (i)
4 16 LOAD_FAST 0 (l)
18 LOAD_METHOD 1 (append)
20 LOAD_FAST 1 (i)
22 CALL_METHOD 1
24 POP_TOP
26 JUMP_ABSOLUTE 12
>> 28 LOAD_CONST 0 (None)
30 RETURN_VALUE
In [5]:
In [5]: dis.dis(f2)
8 0 LOAD_CONST 1 (<code object <listcomp> at 0x7f397abc0d40, file "<ipython-input-1-45c11e415ee9>", line 8>)
2 LOAD_CONST 2 ('f2.<locals>.<listcomp>')
4 MAKE_FUNCTION 0
6 LOAD_GLOBAL 0 (range)
8 LOAD_CONST 3 (5)
10 CALL_FUNCTION 1
12 GET_ITER
14 CALL_FUNCTION 1
16 POP_TOP
18 LOAD_CONST 0 (None)
20 RETURN_VALUE
Disassembly of <code object <listcomp> at 0x7f397abc0d40, file "<ipython-input-1-45c11e415ee9>", line 8>:
8 0 BUILD_LIST 0
2 LOAD_FAST 0 (.0)
>> 4 FOR_ITER 8 (to 14)
6 STORE_FAST 1 (i)
8 LOAD_FAST 1 (i)
10 LIST_APPEND 2
12 JUMP_ABSOLUTE 4
>> 14 RETURN_VALUE
In [6]:
您可以看到,在第一个函数的偏移量 18 处,我们有一个 append
属性,而在使用列表理解的第二个函数中没有这样的东西。所有这些额外的字节码都会使附加方法变慢,因为在这种情况下,您将在每次迭代中加载append
属性,最后它将使代码仅使用列表理解比第二个函数慢大约两倍。
引用this文章,是因为list
的append
属性没有作为函数查找,加载和调用,这需要时间,加起来在迭代中。
即使排除查找和加载 append
函数所需的时间,列表理解仍然更快,因为列表是在 C 中创建的,而不是在 [= 中一次构建一个项目14=].
# Slow
timeit.timeit(stmt='''
for i in range(10000):
t.append(i)''', setup='t=[]', number=10000)
# Faster
timeit.timeit(stmt='''
for i in range(10000):
l(i)''', setup='t=[]; l=t.append', number=10000)
# Faster still
timeit.timeit(stmt='t = [i for i in range(10000)]', number=10000)
我想知道为什么列表理解比附加到列表快得多。我以为区别只是表现力,其实不是。
>>> import timeit
>>> timeit.timeit(stmt='''\
t = []
for i in range(10000):
t.append(i)''', number=10000)
9.467898777974142
>>> timeit.timeit(stmt='t= [i for i in range(10000)]', number=10000)
4.1138417314859
列表理解速度提高了 50%。为什么?
列表理解 基本上只是常规 for
循环的“语法糖”。在这种情况下,它表现更好的原因是因为它不需要加载列表的 append 属性并将其作为函数在每次迭代中调用。换句话说,一般来说,列表理解执行得更快,因为暂停和恢复一个函数的框架,或者在其他情况下的多个函数,比按需创建列表要慢。
考虑以下示例:
In [1]: def f1():
...: l = []
...: for i in range(5):
...: l.append(i)
...:
...:
...: def f2():
...: [i for i in range(5)]
...:
In [3]: import dis
In [4]: dis.dis(f1)
2 0 BUILD_LIST 0
2 STORE_FAST 0 (l)
3 4 LOAD_GLOBAL 0 (range)
6 LOAD_CONST 1 (5)
8 CALL_FUNCTION 1
10 GET_ITER
>> 12 FOR_ITER 14 (to 28)
14 STORE_FAST 1 (i)
4 16 LOAD_FAST 0 (l)
18 LOAD_METHOD 1 (append)
20 LOAD_FAST 1 (i)
22 CALL_METHOD 1
24 POP_TOP
26 JUMP_ABSOLUTE 12
>> 28 LOAD_CONST 0 (None)
30 RETURN_VALUE
In [5]:
In [5]: dis.dis(f2)
8 0 LOAD_CONST 1 (<code object <listcomp> at 0x7f397abc0d40, file "<ipython-input-1-45c11e415ee9>", line 8>)
2 LOAD_CONST 2 ('f2.<locals>.<listcomp>')
4 MAKE_FUNCTION 0
6 LOAD_GLOBAL 0 (range)
8 LOAD_CONST 3 (5)
10 CALL_FUNCTION 1
12 GET_ITER
14 CALL_FUNCTION 1
16 POP_TOP
18 LOAD_CONST 0 (None)
20 RETURN_VALUE
Disassembly of <code object <listcomp> at 0x7f397abc0d40, file "<ipython-input-1-45c11e415ee9>", line 8>:
8 0 BUILD_LIST 0
2 LOAD_FAST 0 (.0)
>> 4 FOR_ITER 8 (to 14)
6 STORE_FAST 1 (i)
8 LOAD_FAST 1 (i)
10 LIST_APPEND 2
12 JUMP_ABSOLUTE 4
>> 14 RETURN_VALUE
In [6]:
您可以看到,在第一个函数的偏移量 18 处,我们有一个 append
属性,而在使用列表理解的第二个函数中没有这样的东西。所有这些额外的字节码都会使附加方法变慢,因为在这种情况下,您将在每次迭代中加载append
属性,最后它将使代码仅使用列表理解比第二个函数慢大约两倍。
引用this文章,是因为list
的append
属性没有作为函数查找,加载和调用,这需要时间,加起来在迭代中。
即使排除查找和加载 append
函数所需的时间,列表理解仍然更快,因为列表是在 C 中创建的,而不是在 [= 中一次构建一个项目14=].
# Slow
timeit.timeit(stmt='''
for i in range(10000):
t.append(i)''', setup='t=[]', number=10000)
# Faster
timeit.timeit(stmt='''
for i in range(10000):
l(i)''', setup='t=[]; l=t.append', number=10000)
# Faster still
timeit.timeit(stmt='t = [i for i in range(10000)]', number=10000)