没有scipy的numpy中的批量卷积2d?
Batch convolution 2d in numpy without scipy?
我有一批 b
m x n
图像存储在数组 x
中,还有一个 f
大小 p x q
的卷积过滤器我想应用于批处理中的每个图像(然后使用总和池并存储在数组 y
中),即 all(np.allclose(y[i][j][k], (x[i, j:j+p, k:k+q] * f).sum()) for i in range(b) for j in range(m-p+1) for k in range(n-q+1))
为真。
适配,我可以写出以下内容:
b, m, n, p, q = 6, 5, 4, 3, 2
x = np.arange(b*m*n).reshape((b, m, n))
f = np.arange(p*q).reshape((p, q))
y = []
for i in range(b):
shape = f.shape + tuple(np.subtract(x[i].shape, f.shape) + 1)
strides = x[i].strides * 2
M = np.lib.stride_tricks.as_strided(x[i], shape=shape, strides=strides)
y.append(np.einsum('ij,ijkl->kl', f, M))
assert all(np.allclose(y[i][j][k], (x[i, j:j+p, k:k+q] * f).sum()) for i in range(b) for j in range(m-p+1) for k in range(n-q+1))
但我认为有一种方法可以只用一个 einsum
,这对我很有用,因为 b
通常在 100 到 1000 之间。
如何调整我的方法以仅使用一个 einsum
?此外,出于我的目的,我无法引入 scipy
或 numpy
之外的任何其他依赖项。
只需要让shape
为5d,让strides
匹配shape
即可。
shape = f.shape + (x.shape[0],) + tuple(np.subtract(x.shape[1:], f.shape) + 1)
strides = (x.strides * 2)[1:]
M = np.lib.stride_tricks.as_strided(x, shape=shape, strides=strides)
y = np.einsum('pq,pqbmn->bmn', f, M)
如果 b
变得非常大,现在 M
可能会变得非常大,但它可以解决您的玩具问题。
我有一批 b
m x n
图像存储在数组 x
中,还有一个 f
大小 p x q
的卷积过滤器我想应用于批处理中的每个图像(然后使用总和池并存储在数组 y
中),即 all(np.allclose(y[i][j][k], (x[i, j:j+p, k:k+q] * f).sum()) for i in range(b) for j in range(m-p+1) for k in range(n-q+1))
为真。
适配
b, m, n, p, q = 6, 5, 4, 3, 2
x = np.arange(b*m*n).reshape((b, m, n))
f = np.arange(p*q).reshape((p, q))
y = []
for i in range(b):
shape = f.shape + tuple(np.subtract(x[i].shape, f.shape) + 1)
strides = x[i].strides * 2
M = np.lib.stride_tricks.as_strided(x[i], shape=shape, strides=strides)
y.append(np.einsum('ij,ijkl->kl', f, M))
assert all(np.allclose(y[i][j][k], (x[i, j:j+p, k:k+q] * f).sum()) for i in range(b) for j in range(m-p+1) for k in range(n-q+1))
但我认为有一种方法可以只用一个 einsum
,这对我很有用,因为 b
通常在 100 到 1000 之间。
如何调整我的方法以仅使用一个 einsum
?此外,出于我的目的,我无法引入 scipy
或 numpy
之外的任何其他依赖项。
只需要让shape
为5d,让strides
匹配shape
即可。
shape = f.shape + (x.shape[0],) + tuple(np.subtract(x.shape[1:], f.shape) + 1)
strides = (x.strides * 2)[1:]
M = np.lib.stride_tricks.as_strided(x, shape=shape, strides=strides)
y = np.einsum('pq,pqbmn->bmn', f, M)
如果 b
变得非常大,现在 M
可能会变得非常大,但它可以解决您的玩具问题。