评估缩放 RMSE
evaluate scaled RMSE
我是机器学习的新手,想了解如何在缩放数据时评估 RMSE。
我使用了加州住房数据集并使用 SVR 对其进行了训练:
from sklearn.datasets import fetch_california_housing
housing = fetch_california_housing()
X = housing["data"]
y = housing["target"]
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
然后我缩放 SVR 的数据并训练模型:
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)
from sklearn.svm import LinearSVR
lin_svr = LinearSVR(random_state=42)
lin_svr.fit(X_train_scaled, y_train)
当我想评估 RMSE 时,结果被缩放,所以它对我来说没有多大意义:
from sklearn.metrics import mean_squared_error
y_pred = lin_svr.predict(X_train_scaled)
rmse = np.sqrt(mean_squared_error(y_train, y_pred))
rmse 为 0.976993881287582
我如何理解结果? (y栏是几万美金)
我尝试 y_pred
通过取消缩放数据,但结果没有意义:
y_pred = lin_svr.predict(X_test_scaled)
mse = mean_squared_error(y_test, y_pred)
np.sqrt(mse)
所以问题是,当数据被缩放时我如何解释 RMSE 以及是否有正确的方法来取消缩放以理解它
谢谢!
这里没有缩放目标变量,所以rmse的单位和目标变量一样。因为目标变量以 100,000 美元为单位,rmse 一个测量值来定义观察数据和预测数据之间的差异。这意味着 rmse = 0.976993881287582 => 97,699 美元。
我是机器学习的新手,想了解如何在缩放数据时评估 RMSE。 我使用了加州住房数据集并使用 SVR 对其进行了训练:
from sklearn.datasets import fetch_california_housing
housing = fetch_california_housing()
X = housing["data"]
y = housing["target"]
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
然后我缩放 SVR 的数据并训练模型:
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)
from sklearn.svm import LinearSVR
lin_svr = LinearSVR(random_state=42)
lin_svr.fit(X_train_scaled, y_train)
当我想评估 RMSE 时,结果被缩放,所以它对我来说没有多大意义:
from sklearn.metrics import mean_squared_error
y_pred = lin_svr.predict(X_train_scaled)
rmse = np.sqrt(mean_squared_error(y_train, y_pred))
rmse 为 0.976993881287582
我如何理解结果? (y栏是几万美金)
我尝试 y_pred
通过取消缩放数据,但结果没有意义:
y_pred = lin_svr.predict(X_test_scaled)
mse = mean_squared_error(y_test, y_pred)
np.sqrt(mse)
所以问题是,当数据被缩放时我如何解释 RMSE 以及是否有正确的方法来取消缩放以理解它
谢谢!
这里没有缩放目标变量,所以rmse的单位和目标变量一样。因为目标变量以 100,000 美元为单位,rmse 一个测量值来定义观察数据和预测数据之间的差异。这意味着 rmse = 0.976993881287582 => 97,699 美元。