使矩阵乘法运算符@适用于 numpy 中的标量
Make the matrix multiplication operator @ work for scalars in numpy
在 python 3.5 中,在 PEP465. This is implemented e.g. in numpy as the matmul operator.
之后,为矩阵乘法引入了 @
运算符
但是,正如 PEP 所建议的,numpy 运算符在使用标量操作数调用时会抛出异常:
>>> import numpy as np
>>> np.array([[1,2],[3,4]]) @ np.array([[1,2],[3,4]]) # works
array([[ 7, 10],
[15, 22]])
>>> 1 @ 2 # doesn't work
Traceback (most recent call last):
File "<input>", line 1, in <module>
TypeError: unsupported operand type(s) for @: 'int' and 'int'
这对我来说是一个真正的障碍,因为我正在实现应该适用于标量和矩阵的数字信号处理算法。这两种情况的方程在数学上完全等价,这并不奇怪,因为“一维 x 一维矩阵乘法”等价于标量乘法。然而,当前状态迫使我编写重复代码以正确处理这两种情况。
那么,鉴于当前状态并不令人满意,是否有任何合理的方法可以使 @
运算符适用于标量?我考虑过向标量数据类型添加自定义 __matmul__(self, other)
方法,但考虑到涉及的内部数据类型的数量,这似乎很麻烦。我可以更改 numpy 数组数据类型的 __matmul__
方法的实现以不抛出 1x1 数组操作数的异常吗?
另外,这个设计决定背后的基本原理是什么?在我的脑海中,我想不出有什么令人信服的理由不为标量实现该运算符。
As suggested, you can work around this issue by forcing some minimal dimensionality on objects being multiplied. There are two reasonable options: atleast_1d and atleast_2d 对于 @
返回的类型有不同的结果:标量与 1×1 二维数组。
x = 3
y = 5
z = np.atleast_1d(x) @ np.atleast_1d(y) # returns 15
z = np.atleast_2d(x) @ np.atleast_2d(y) # returns array([[15]])
但是:
- 如果 x 和 y 是一维数组,否则使用 atleast_2d 将导致错误,否则会正常相乘
- 使用atleast_1d 将导致乘积为标量或矩阵,而您不知道是哪个。
- 这两个都比
np.dot(x, y)
更冗长,np.dot(x, y)
可以处理所有这些情况。
此外,atleast_1d 版本也存在同样的缺陷,如果使用 scalar @scalar = scalar: 你不知道可以用输出做什么。 z.T
或 z.shape
会抛出错误吗?这些适用于 1×1 矩阵但不适用于标量。在 Python 的设置中,不能忽略标量和 1×1 数组之间的区别,而不放弃后者具有的所有方法和属性。
在 python 3.5 中,在 PEP465. This is implemented e.g. in numpy as the matmul operator.
之后,为矩阵乘法引入了@
运算符
但是,正如 PEP 所建议的,numpy 运算符在使用标量操作数调用时会抛出异常:
>>> import numpy as np
>>> np.array([[1,2],[3,4]]) @ np.array([[1,2],[3,4]]) # works
array([[ 7, 10],
[15, 22]])
>>> 1 @ 2 # doesn't work
Traceback (most recent call last):
File "<input>", line 1, in <module>
TypeError: unsupported operand type(s) for @: 'int' and 'int'
这对我来说是一个真正的障碍,因为我正在实现应该适用于标量和矩阵的数字信号处理算法。这两种情况的方程在数学上完全等价,这并不奇怪,因为“一维 x 一维矩阵乘法”等价于标量乘法。然而,当前状态迫使我编写重复代码以正确处理这两种情况。
那么,鉴于当前状态并不令人满意,是否有任何合理的方法可以使 @
运算符适用于标量?我考虑过向标量数据类型添加自定义 __matmul__(self, other)
方法,但考虑到涉及的内部数据类型的数量,这似乎很麻烦。我可以更改 numpy 数组数据类型的 __matmul__
方法的实现以不抛出 1x1 数组操作数的异常吗?
另外,这个设计决定背后的基本原理是什么?在我的脑海中,我想不出有什么令人信服的理由不为标量实现该运算符。
As @
返回的类型有不同的结果:标量与 1×1 二维数组。
x = 3
y = 5
z = np.atleast_1d(x) @ np.atleast_1d(y) # returns 15
z = np.atleast_2d(x) @ np.atleast_2d(y) # returns array([[15]])
但是:
- 如果 x 和 y 是一维数组,否则使用 atleast_2d 将导致错误,否则会正常相乘
- 使用atleast_1d 将导致乘积为标量或矩阵,而您不知道是哪个。
- 这两个都比
np.dot(x, y)
更冗长,np.dot(x, y)
可以处理所有这些情况。
此外,atleast_1d 版本也存在同样的缺陷,如果使用 scalar @scalar = scalar: 你不知道可以用输出做什么。 z.T
或 z.shape
会抛出错误吗?这些适用于 1×1 矩阵但不适用于标量。在 Python 的设置中,不能忽略标量和 1×1 数组之间的区别,而不放弃后者具有的所有方法和属性。