Data/Feature归一化
Data/Feature normalization
我在区间 (-1,1) 内有一组特征。我正在寻找一个双射函数或程序来将数据归一化到某个范围,均值接近 0,方差接近 1。
该函数是双射的,这一点非常重要,因为我需要将特征标准化为具有 tanh 激活函数的中性网络的输入。我的过程是在内存中转换数据,将它们提供给网络并将网络结果转换回初始规模。
这种归一化任务在神经网络应用中很常见。最常见的方法是简单地计算数据的均值和标准差,并将该值存储在训练程序中。因此,您的数据管道是:
- 计算输入数据的
mean
和 sd
并将其存储在内存中。
- 应用归一化转换:
normed_data = (data - mean) / sd
。
- 训练/评估/使用网络。
- 非规范化数据使用:
original_data = (normed_data * sd) + mean
。
我写了一篇关于数据规范化的文章 post。你可以阅读 .
我在区间 (-1,1) 内有一组特征。我正在寻找一个双射函数或程序来将数据归一化到某个范围,均值接近 0,方差接近 1。
该函数是双射的,这一点非常重要,因为我需要将特征标准化为具有 tanh 激活函数的中性网络的输入。我的过程是在内存中转换数据,将它们提供给网络并将网络结果转换回初始规模。
这种归一化任务在神经网络应用中很常见。最常见的方法是简单地计算数据的均值和标准差,并将该值存储在训练程序中。因此,您的数据管道是:
- 计算输入数据的
mean
和sd
并将其存储在内存中。 - 应用归一化转换:
normed_data = (data - mean) / sd
。 - 训练/评估/使用网络。
- 非规范化数据使用:
original_data = (normed_data * sd) + mean
。
我写了一篇关于数据规范化的文章 post。你可以阅读