Standardization/preprocessing 对于 4 维数组

Standardization/preprocessing for 4-dimensional array

我想将我的数据标准化为零均值和标准差 = 1。我的数据的形状是 28783x4x24x7,它可以被认为是具有 4 个通道和 24x7 尺寸的 28783 张图像。渠道需要标准化。如何在指定第二维包含特征的同时进行标准化?

我找到了一种方法。它可能不是最有效的,但它也允许我使用这种方法进行交叉验证,我只想从我的训练数据中获取均值和标准差,但将操作应用于训练和测试数据。如果您只想要一个维度的平均值,则可以在任意数量的维度上使用它。请参阅下面的示例代码:

n_user = 3
n_channel = 2
n_pixels = 3
A = np.zeros(shape=(n_user, n_channel, n_pixels))

for i in range(n_user):
    A[i, 0, :] = np.arange(n_pixels)
    A[i, 1, :] = np.arange(n_pixels) + n_pixels
print A

mu_f    = np.zeros(shape=n_channel)
sigma_f = np.zeros(shape=n_channel)

for i in range(n_channel):
    mu_f[i]    = np.mean(A[:,i,:])
    sigma_f[i] = np.std(A[:,i,:])

print mu_f
print sigma_f

for i in range(n_channel):
    A[:, i, :] -= mu_f[i]
    A[:, i, :] /= sigma_f[i]

print A

print np.mean(A[:,0,:])
print np.std(A[:,0,:])