Data/Feature归一化

Data/Feature normalization

我在区间 (-1,1) 内有一组特征。我正在寻找一个双射函数或程序来将数据归一化到某个范围,均值接近 0,方差接近 1。

该函数是双射的,这一点非常重要,因为我需要将特征标准化为具有 tanh 激活函数的中性网络的输入。我的过程是在内存中转换数据,将它们提供给网络并将网络结果转换回初始规模。

这种归一化任务在神经网络应用中很常见。最常见的方法是简单地计算数据的均值和标准差,并将该值存储在训练程序中。因此,您的数据管道是:

  1. 计算输入数据的 meansd 并将其存储在内存中。
  2. 应用归一化转换:normed_data = (data - mean) / sd
  3. 训练/评估/使用网络。
  4. 非规范化数据使用:original_data = (normed_data * sd) + mean

我写了一篇关于数据规范化的文章 post。你可以阅读 .