使矩阵乘法运算符@适用于 numpy 中的标量

Make the matrix multiplication operator @ work for scalars in numpy

在 python 3.5 中,在 PEP465. This is implemented e.g. in numpy as the matmul operator.

之后,为矩阵乘法引入了 @ 运算符

但是,正如 PEP 所建议的,numpy 运算符在使用标量操作数调用时会抛出异常:

>>> import numpy as np
>>> np.array([[1,2],[3,4]]) @ np.array([[1,2],[3,4]])    # works
array([[ 7, 10],
       [15, 22]])
>>> 1 @ 2                                                # doesn't work
Traceback (most recent call last):
  File "<input>", line 1, in <module>
TypeError: unsupported operand type(s) for @: 'int' and 'int'

这对我来说是一个真正的障碍,因为我正在实现应该适用于标量和矩阵的数字信号处理算法。这两种情况的方程在数学上完全等价,这并不奇怪,因为“一维 x 一维矩阵乘法”等价于标量乘法。然而,当前状态迫使我编写重复代码以正确处理这两种情况。

那么,鉴于当前状态并不令人满意,是否有任何合理的方法可以使 @ 运算符适用于标量?我考虑过向标量数据类型添加自定义 __matmul__(self, other) 方法,但考虑到涉及的内部数据类型的数量,这似乎很麻烦。我可以更改 numpy 数组数据类型的 __matmul__ 方法的实现以不抛出 1x1 数组操作数的异常吗?

另外,这个设计决定背后的基本原理是什么?在我的脑海中,我想不出有什么令人信服的理由不为标量实现该运算符。

As suggested, you can work around this issue by forcing some minimal dimensionality on objects being multiplied. There are two reasonable options: atleast_1d and atleast_2d 对于 @ 返回的类型有不同的结果:标量与 1×1 二维数组。

x = 3
y = 5
z = np.atleast_1d(x) @ np.atleast_1d(y)   # returns 15 
z = np.atleast_2d(x) @ np.atleast_2d(y)   # returns array([[15]])

但是:

  • 如果 x 和 y 是一维数组,否则使用 atleast_2d 将导致错误,否则会正常相乘
  • 使用atleast_1d 将导致乘积为标量或矩阵,而您不知道是哪个。
  • 这两个都比 np.dot(x, y) 更冗长,np.dot(x, y) 可以处理所有这些情况。

此外,atleast_1d 版本也存在同样的缺陷,如果使用 scalar @scalar = scalar: 你不知道可以用输出做什么。 z.Tz.shape 会抛出错误吗?这些适用于 1×1 矩阵但不适用于标量。在 Python 的设置中,不能忽略标量和 1×1 数组之间的区别,而不放弃后者具有的所有方法和属性。