使矩阵乘法运算符@适用于 numpy 中的标量

Question

在 python 3.5 中，在 PEP465. This is implemented e.g. in numpy as the matmul operator.

之后，为矩阵乘法引入了 @ 运算符

但是，正如 PEP 所建议的，numpy 运算符在使用标量操作数调用时会抛出异常：

>>> import numpy as np
>>> np.array([[1,2],[3,4]]) @ np.array([[1,2],[3,4]])    # works
array([[ 7, 10],
       [15, 22]])
>>> 1 @ 2                                                # doesn't work
Traceback (most recent call last):
  File "<input>", line 1, in <module>
TypeError: unsupported operand type(s) for @: 'int' and 'int'

这对我来说是一个真正的障碍，因为我正在实现应该适用于标量和矩阵的数字信号处理算法。这两种情况的方程在数学上完全等价，这并不奇怪，因为“一维 x 一维矩阵乘法”等价于标量乘法。然而，当前状态迫使我编写重复代码以正确处理这两种情况。

那么，鉴于当前状态并不令人满意，是否有任何合理的方法可以使 @ 运算符适用于标量？我考虑过向标量数据类型添加自定义 __matmul__(self, other) 方法，但考虑到涉及的内部数据类型的数量，这似乎很麻烦。我可以更改 numpy 数组数据类型的 __matmul__ 方法的实现以不抛出 1x1 数组操作数的异常吗？

另外，这个设计决定背后的基本原理是什么？在我的脑海中，我想不出有什么令人信服的理由不为标量实现该运算符。

Answer 1

As suggested, you can work around this issue by forcing some minimal dimensionality on objects being multiplied. There are two reasonable options: atleast_1d and atleast_2d 对于 @ 返回的类型有不同的结果：标量与 1×1 二维数组。

x = 3
y = 5
z = np.atleast_1d(x) @ np.atleast_1d(y)   # returns 15 
z = np.atleast_2d(x) @ np.atleast_2d(y)   # returns array([[15]])

但是：

如果 x 和 y 是一维数组，否则使用 atleast_2d 将导致错误，否则会正常相乘
使用atleast_1d 将导致乘积为标量或矩阵，而您不知道是哪个。
这两个都比 np.dot(x, y) 更冗长，np.dot(x, y) 可以处理所有这些情况。

此外，atleast_1d 版本也存在同样的缺陷，如果使用 scalar @scalar = scalar: 你不知道可以用输出做什么。 z.T 或 z.shape 会抛出错误吗？这些适用于 1×1 矩阵但不适用于标量。在 Python 的设置中，不能忽略标量和 1×1 数组之间的区别，而不放弃后者具有的所有方法和属性。

使矩阵乘法运算符@适用于 numpy 中的标量

Make the matrix multiplication operator @ work for scalars in numpy

python

signal-processing

numpy

linear-algebra

matrix-multiplication