Python: numpy.dot / numpy.tensordot 对于多维数组

Python: numpy.dot / numpy.tensordot for multidimensional arrays

我正在优化反向传播算法的实现以训练神经网络。我正在处理的一个方面是对数据点集(input/output 向量)执行矩阵运算,作为由 numpy 库优化的批处理过程,而不是遍历每个数据点。

在我原来的算法中,我做了以下事情:

for datapoint in datapoints:
  A = ... (created out of datapoint info)
  B = ... (created out of datapoint info)

  C = np.dot(A,B.transpose())
____________________

A: (7,1) numpy array
B: (6,1) numpy array
C: (7,6) numpy array

然后我将所述矩阵扩展为张量,其中第一个形状索引将引用数据集。如果我有 3 个数据集(为简单起见),矩阵将如下所示:

A: (3,7,1) numpy array
B: (3,6,1) numpy array
C: (3,7,6) numpy array

仅使用 np.tensordot 或其他 numpy 操作,如何生成 C?

我想答案应该是这样的:

C = np.tensordot(A.[some manipulation], B.[some manipulation], axes = (...))

(这是一个更复杂的应用程序的一部分,我构建事物的方式不再灵活。如果我找不到解决方案,我将只循环遍历数据集并为每个数据集执行乘法)

我们可以使用np.einsum-

c = np.einsum('ijk,ilm->ijl',a,b)

由于最后一个轴是单轴的,你最好使用切片数组 -

c = np.einsum('ij,il->ijl',a[...,0],b[...,0])

np.matmul/@-operator-

c = a@b.swapaxes(1,2)