numpy einsum() 可以在轨迹的各段之间执行叉积吗
Can numpy einsum() perform a cross-product between segments of a trajectory
我使用以下脚本执行轨迹(xy 坐标)的连续段的叉积:
In [129]:
def func1(xy, s):
size = xy.shape[0]-2*s
out = np.zeros(size)
for i in range(size):
p1, p2 = xy[i], xy[i+s] #segment 1
p3, p4 = xy[i+s], xy[i+2*s] #segment 2
out[i] = np.cross(p1-p2, p4-p3)
return out
def func2(xy, s):
size = xy.shape[0]-2*s
p1 = xy[0:size]
p2 = xy[s:size+s]
p3 = p2
p4 = xy[2*s:size+2*s]
tmp1 = p1-p2
tmp2 = p4-p3
return tmp1[:, 0] * tmp2[:, 1] - tmp2[:, 0] * tmp1[:, 1]
In [136]:
xy = np.array([[1,2],[2,3],[3,4],[5,6],[7,8],[2,4],[5,2],[9,9],[1,1]])
func2(xy, 2)
Out[136]:
array([ 0, -3, 16, 1, 22])
func1 由于内部循环特别慢,所以我自己重写了叉积 (func2),速度快了几个数量级。
是否可以使用numpy的einsum函数进行同样的计算?
einsum
仅计算乘积之和,但您可以通过反转 tmp2
的列并更改第一列的符号来将叉积硬塞进乘积之和:
def func3(xy, s):
size = xy.shape[0]-2*s
tmp1 = xy[0:size] - xy[s:size+s]
tmp2 = xy[2*s:size+2*s] - xy[s:size+s]
tmp2 = tmp2[:, ::-1]
tmp2[:, 0] *= -1
return np.einsum('ij,ij->i', tmp1, tmp2)
但是 func3
比 func2
慢。
In [80]: xy = np.tile(xy, (1000, 1))
In [104]: %timeit func1(xy, 2)
10 loops, best of 3: 67.5 ms per loop
In [105]: %timeit func2(xy, 2)
10000 loops, best of 3: 73.2 µs per loop
In [106]: %timeit func3(xy, 2)
10000 loops, best of 3: 108 µs per loop
完整性检查:
In [86]: np.allclose(func1(xy, 2), func3(xy, 2))
Out[86]: True
我认为 func2
在这里击败 einsum
的原因是因为与手动编写相比,在 einsum
中设置循环仅两次迭代的成本太高求和,反转和乘法也耗费了一些时间。
np.cross
是一只聪明的小兽,可以毫无问题地处理广播。因此,您可以将 func2
重写为:
def func2(xy, s):
size = xy.shape[0]-2*s
p1 = xy[0:size]
p2 = xy[s:size+s]
p3 = p2
p4 = xy[2*s:size+2*s]
return np.cross(p1-p2, p4-p3)
它会产生正确的结果:
>>> func2(xy, 2)
array([ 0, -3, 16, 1, 22])
在最新的 numpy 中,它可能 运行 比你的代码快一点,因为它被重写以最小化中间数组的创建。可以看看源码(纯Python)here.
我使用以下脚本执行轨迹(xy 坐标)的连续段的叉积:
In [129]:
def func1(xy, s):
size = xy.shape[0]-2*s
out = np.zeros(size)
for i in range(size):
p1, p2 = xy[i], xy[i+s] #segment 1
p3, p4 = xy[i+s], xy[i+2*s] #segment 2
out[i] = np.cross(p1-p2, p4-p3)
return out
def func2(xy, s):
size = xy.shape[0]-2*s
p1 = xy[0:size]
p2 = xy[s:size+s]
p3 = p2
p4 = xy[2*s:size+2*s]
tmp1 = p1-p2
tmp2 = p4-p3
return tmp1[:, 0] * tmp2[:, 1] - tmp2[:, 0] * tmp1[:, 1]
In [136]:
xy = np.array([[1,2],[2,3],[3,4],[5,6],[7,8],[2,4],[5,2],[9,9],[1,1]])
func2(xy, 2)
Out[136]:
array([ 0, -3, 16, 1, 22])
func1 由于内部循环特别慢,所以我自己重写了叉积 (func2),速度快了几个数量级。
是否可以使用numpy的einsum函数进行同样的计算?
einsum
仅计算乘积之和,但您可以通过反转 tmp2
的列并更改第一列的符号来将叉积硬塞进乘积之和:
def func3(xy, s):
size = xy.shape[0]-2*s
tmp1 = xy[0:size] - xy[s:size+s]
tmp2 = xy[2*s:size+2*s] - xy[s:size+s]
tmp2 = tmp2[:, ::-1]
tmp2[:, 0] *= -1
return np.einsum('ij,ij->i', tmp1, tmp2)
但是 func3
比 func2
慢。
In [80]: xy = np.tile(xy, (1000, 1))
In [104]: %timeit func1(xy, 2)
10 loops, best of 3: 67.5 ms per loop
In [105]: %timeit func2(xy, 2)
10000 loops, best of 3: 73.2 µs per loop
In [106]: %timeit func3(xy, 2)
10000 loops, best of 3: 108 µs per loop
完整性检查:
In [86]: np.allclose(func1(xy, 2), func3(xy, 2))
Out[86]: True
我认为 func2
在这里击败 einsum
的原因是因为与手动编写相比,在 einsum
中设置循环仅两次迭代的成本太高求和,反转和乘法也耗费了一些时间。
np.cross
是一只聪明的小兽,可以毫无问题地处理广播。因此,您可以将 func2
重写为:
def func2(xy, s):
size = xy.shape[0]-2*s
p1 = xy[0:size]
p2 = xy[s:size+s]
p3 = p2
p4 = xy[2*s:size+2*s]
return np.cross(p1-p2, p4-p3)
它会产生正确的结果:
>>> func2(xy, 2)
array([ 0, -3, 16, 1, 22])
在最新的 numpy 中,它可能 运行 比你的代码快一点,因为它被重写以最小化中间数组的创建。可以看看源码(纯Python)here.