如何在相同范围内对所有参数的数据进行归一化

Question

我有 csv 文件，
数据：

产量：1172.4、1712.7、863.88、2731.34、5220

雨量(mm): 113.6 , 152.3 , 181.9 , 152.3 , 125.3

虚拟(types_of_soil) : 1 , 0 , 0 , 2 , 1

虚拟变量： 1 ==> 中等黑土

0 ==> 深黑色

2 ==> 萝卜棕

因变量（y）：产量

独立变量：雨，虚拟（土壤类型）

所以，我想规范化这些数据，如何在 1 到 10 的范围内缩放数据？

我尝试使用公式： (xi - min ) / (max - min ) 正确吗？

以及如何缩放二进制变量（虚拟）的数据？

Answer 1

您可以使用此代码规范化数据

import pandas
import scipy
import numpy
from sklearn.preprocessing import MinMaxScaler
url = "filename.csv"
names = ['yield','Rain','types of soil']
dataframe = pandas.read_csv(url, names=names)
array = dataframe.values
# separate array into input and output components
X = array[:,]  **select x independent variable**
Y = array[:,]  **select y dependent variable**
scaler = MinMaxScaler(feature_range=(0, 1))
rescaledX = scaler.fit_transform(X)
# summarize transformed data
numpy.set_printoptions(precision=3)
print(rescaledX[0:5,:])

了解更多详情。看到这个 link http://machinelearningmastery.com/prepare-data-machine-learning-python-scikit-learn/

如何在相同范围内对所有参数的数据进行归一化

How to normalize data for all parameters at same range of scale

normalize

normalization