NumPy ndarray 广播 - 形状 (X,) vs (X, 1) 与 (X,Y) 一起操作
NumPy ndarray broadcasting - shape (X,) vs (X, 1) to operate with (X,Y)
我有一个 NumPy ndarray
,其形状为 (32, 1024) 并包含 32 个信号测量值,我想将其组合成一个 1024 元素长的数组,32 个元素中的每一个具有不同的权重. 我使用的是 numpy.average
,但我的权重很复杂,average
根据总和对权重进行归一化,这会影响我的结果。
查看平均值的代码,我意识到我可以通过将权重乘以信号数组然后在第一个轴上求和来完成同样的事情。但是,当我尝试将 (32,) 权重数组乘以 (32, 1024) 信号数组时,我得到维度不匹配,因为 (32,) 无法广播到 (32, 1024)。如果我将权重数组重塑为 (32, 1) 那么一切都会按预期工作,但是这会导致相当难看的代码:
avg = (weights.reshape((32, 1)) * data).sum(axis=0)
谁能解释为什么 NumPy 不允许我的 (32,) 数组广播到 (32, 1024) and/or 建议一个更简洁的替代方法来执行加权平均?
(X,)
和 (X,Y)
形数组之间对齐的通用设置
关于为什么(32,)
不能广播到(32, 1024)
的问题,是因为形状没有正确对齐。将其放入示意图中,我们有:
weights : 32
data : 32 x 1024
我们需要对齐唯一的轴,即 weights
的第一个轴与 data
的第一个轴对齐。因此,正如您发现的那样,一种方法是 reshape
到 2D
,这样我们最终会得到一个单独的维度作为第二个轴。这可以通过引入带有 None/np.newaxis
的新轴来实现:weights[:,np.newaxis]
或 weights[:,None]
或简单的整形:weights.reshape(-1,1)
。因此,回到原理图,我们将使用修改后的版本:
weights[:,None] : 32 x 1
data : 32 x 1024
现在,形状已对齐,我们可以在这两者之间执行任何通用的逐元素操作,结果示意图如下所示 -
weights[:,None] : 32 x 1
data : 32 x 1024
result : 32 x 1024
这将广播 weights
并且将使用 data
执行相关的逐元素操作,结果是 result
.
解决我们的具体案例和备选方案
根据上一节的讨论,要解决我们的逐元素乘法的情况,应该是 weights[:,None]*data
然后求和 axis=0
,即 -
(weights[:,None]*data).sum(axis=0)
让我们寻找简洁的替代品!
一种简洁且可能直观的方法是 np.einsum
-
np.einsum('i,ij->j',weights,data)
另一种方法是使用 np.dot
进行矩阵乘法,因为我们失去了 weights
的第一个轴相对于 data
的第一个轴,就像这样 -
weights.dot(data)
我有一个 NumPy ndarray
,其形状为 (32, 1024) 并包含 32 个信号测量值,我想将其组合成一个 1024 元素长的数组,32 个元素中的每一个具有不同的权重. 我使用的是 numpy.average
,但我的权重很复杂,average
根据总和对权重进行归一化,这会影响我的结果。
查看平均值的代码,我意识到我可以通过将权重乘以信号数组然后在第一个轴上求和来完成同样的事情。但是,当我尝试将 (32,) 权重数组乘以 (32, 1024) 信号数组时,我得到维度不匹配,因为 (32,) 无法广播到 (32, 1024)。如果我将权重数组重塑为 (32, 1) 那么一切都会按预期工作,但是这会导致相当难看的代码:
avg = (weights.reshape((32, 1)) * data).sum(axis=0)
谁能解释为什么 NumPy 不允许我的 (32,) 数组广播到 (32, 1024) and/or 建议一个更简洁的替代方法来执行加权平均?
(X,)
和 (X,Y)
形数组之间对齐的通用设置
关于为什么(32,)
不能广播到(32, 1024)
的问题,是因为形状没有正确对齐。将其放入示意图中,我们有:
weights : 32
data : 32 x 1024
我们需要对齐唯一的轴,即 weights
的第一个轴与 data
的第一个轴对齐。因此,正如您发现的那样,一种方法是 reshape
到 2D
,这样我们最终会得到一个单独的维度作为第二个轴。这可以通过引入带有 None/np.newaxis
的新轴来实现:weights[:,np.newaxis]
或 weights[:,None]
或简单的整形:weights.reshape(-1,1)
。因此,回到原理图,我们将使用修改后的版本:
weights[:,None] : 32 x 1
data : 32 x 1024
现在,形状已对齐,我们可以在这两者之间执行任何通用的逐元素操作,结果示意图如下所示 -
weights[:,None] : 32 x 1
data : 32 x 1024
result : 32 x 1024
这将广播 weights
并且将使用 data
执行相关的逐元素操作,结果是 result
.
解决我们的具体案例和备选方案
根据上一节的讨论,要解决我们的逐元素乘法的情况,应该是 weights[:,None]*data
然后求和 axis=0
,即 -
(weights[:,None]*data).sum(axis=0)
让我们寻找简洁的替代品!
一种简洁且可能直观的方法是 np.einsum
-
np.einsum('i,ij->j',weights,data)
另一种方法是使用 np.dot
进行矩阵乘法,因为我们失去了 weights
的第一个轴相对于 data
的第一个轴,就像这样 -
weights.dot(data)