在 python 中将 4 维数组与 2 维数组相乘和求和的最快方法?
Fastest way to multiply and sum 4D array with 2D array in python?
这是我的问题。我有两个矩阵 A
和 B
,具有复杂的条目,维度分别为 (n,n,m,m)
和 (n,n)
。
下面是我为得到矩阵而执行的操作C
-
C = np.sum(B[:,:,None,None]*A, axis=(0,1))
以上计算一次大约需要 6-8 秒。由于我必须计算很多这样的 C
,所以会花费很多时间。有没有更快的方法来做到这一点? (我在多核上使用 JAX NumPy 来做这些 CPU;普通的 NumPy 需要更长的时间)
n=77
和 m=512
,如果您想知道的话。当我在集群上工作时,我可以并行化,但数组的绝对大小会消耗大量内存。
看起来你想要einsum
:
C = np.einsum('ijkl,ij->kl', A, B)
在 Colab 上使用 numpy CPU 我明白了:
import numpy as np
x = np.random.rand(50, 50, 500, 500)
y = np.random.rand(50, 50)
def f1(x, y):
return np.sum(y[:,:,None,None]*x, axis=(0,1))
def f2(x, y):
return np.einsum('ijkl,ij->kl', x, y)
np.testing.assert_allclose(f1(x, y), f2(x, y))
%timeit f1(x, y)
# 1 loop, best of 5: 1.52 s per loop
%timeit f2(x, y)
# 1 loop, best of 5: 620 ms per loop
这是我的问题。我有两个矩阵 A
和 B
,具有复杂的条目,维度分别为 (n,n,m,m)
和 (n,n)
。
下面是我为得到矩阵而执行的操作C
-
C = np.sum(B[:,:,None,None]*A, axis=(0,1))
以上计算一次大约需要 6-8 秒。由于我必须计算很多这样的 C
,所以会花费很多时间。有没有更快的方法来做到这一点? (我在多核上使用 JAX NumPy 来做这些 CPU;普通的 NumPy 需要更长的时间)
n=77
和 m=512
,如果您想知道的话。当我在集群上工作时,我可以并行化,但数组的绝对大小会消耗大量内存。
看起来你想要einsum
:
C = np.einsum('ijkl,ij->kl', A, B)
在 Colab 上使用 numpy CPU 我明白了:
import numpy as np
x = np.random.rand(50, 50, 500, 500)
y = np.random.rand(50, 50)
def f1(x, y):
return np.sum(y[:,:,None,None]*x, axis=(0,1))
def f2(x, y):
return np.einsum('ijkl,ij->kl', x, y)
np.testing.assert_allclose(f1(x, y), f2(x, y))
%timeit f1(x, y)
# 1 loop, best of 5: 1.52 s per loop
%timeit f2(x, y)
# 1 loop, best of 5: 620 ms per loop