改进加权移动平均滤波器函数的运行时间？

Question

我有一个加权移动平均函数，它通过使用高斯加权机制对每个点的左侧和右侧的 3* 宽度值进行平均来平滑曲线。我只担心平滑由 [start, end] 界定的区域。以下代码有效，但问题是大型数组的运行时。

import numpy as np
def weighted_moving_average(x, y, start, end, width = 3):
    def gaussian(x, a, m, s):
        return a*exp(-(x-m)**2/(2*s**2))
    cut = (x>=start-3*width)*(x<=end+3*width)
    x, y = x[cut], y[cut]
    x_avg = x[(x>=start)*(x<=end)]
    y_avg = np.zeros(len(x_avg))
    bin_vals = np.arange(-3*width,3*width+1)
    weights = gaussian(bin_vals, 1, 0, width)
    for i in range(len(x_avg)):
        y_vals = y[i:i+6*width+1]
        y_avg[i] = np.average(y_vals, weights = weights)
    return x_avg, y_avg

据我了解，循环遍历 NumPy 数组通常效率很低。我想知道是否有人有想法用运行时效率更高的东西替换 for 循环。

谢谢

Answer 1

加权 window 上的切片和 summing/averaging 基本上对应于翻转内核的一维卷积。现在，for 1D convolution, NumPy has a very efficient implementation in np.convolve 可以用来摆脱循环并给我们 y_avg。因此，我们将有一个像这样的矢量化实现 -

y_sums = np.convolve(y,weights[::-1],'valid')
y_avg = np.true_divide(y_sums,weights.sum())

Answer 2

在大数组上循环的主要问题是大数组的内存分配可能很昂贵，并且整个事情必须在循环开始之前进行初始化。

在这种特殊情况下，我同意 Divakar 所说的。

一般来说，如果您发现自己 确实需要 遍历大型集合，请使用 迭代器 而不是阵列。对于像这样相对简单的情况，只需将 range 替换为 xrange（参见 https://docs.python.org/2/library/functions.html#xrange）。

改进加权移动平均滤波器函数的运行时间？

Improving runtime of weighted moving average filter function?

python

numpy

runtime

vectorization

ipython