为什么将列表(长度为 n)传递给 numba nopython 函数 O(n) 操作

Why is passing a list (of length n) to a numba nopython function an O(n) operation

这个问题只是为了满足我的好奇心,我实际上并不打算使用列表作为 numba 函数的参数。

但我想知道为什么将列表传递给 numba 函数看起来像是一个 O(n) 操作,而在纯 Python 函数中它是一个 O(1) 操作。

一些简单的示例代码:

import numba as nb

@nb.njit
def take_list(lst):
    return None

take_list([1, 2, 3])  # warmup

时间:

for size in [10, 100, 1000, 10000, 100000, 1000000]:

    lst = [0]*size
    print(len(lst))
    %timeit take_list(lst)   # IPythons "magic" timeit

结果:

10
4.06 µs ± 26.1 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
100
14 µs ± 360 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
1000
109 µs ± 434 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
10000
1.08 ms ± 17.8 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
100000
10.7 ms ± 26.2 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
1000000
112 ms ± 383 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)

操作 Python 列表需要 Python API 次调用,这在 nopython 模式下是被禁止的。 Numba 实际上将列表内容复制到它自己的数据结构中,这花费的时间与列表的大小成正比。