计算均方误差 return y_true 和 y_pred 有不同的输出数 (1!=10)

Calculating mean square error return y_true and y_pred have different number of output (1!=10)

我对深度学习真的很陌生。我想做一个任务:根据测试数据评估模型并计算预测混凝土强度与实际混凝土强度之间的均方误差。您可以使用 Scikit-learn 中的 mean_squared_error 函数。

这是我的代码:

import pandas as pd
from tensorflow.python.keras import Sequential
from tensorflow.python.keras.layers import Dense
from sklearn.model_selection import train_test_split

concrete_data = pd.read_csv('https://cocl.us/concrete_data')

n_cols = concrete_data.shape[1]
model = Sequential()
model.add(Dense(units=10, activation='relu', input_shape=(n_cols-1,)))

model.compile(loss='mean_squared_error',
          optimizer='adam')


y = concrete_data.Cement
x = concrete_data.drop('Cement', axis=1)
xTrain, xTest, yTrain, yTest = train_test_split(x, y, test_size = 0.3)

model.fit(xTrain, yTrain, epochs=50)

现在为了评估均方误差,我写了这个:

from sklearn.metrics import mean_squared_error
predicted_y = model.predict(xTest)
mean_squared_error(yTest, predicted_y)

我得到了这个错误:

y_true and y_pred have different number of output (1!=10)

我的 predicted_y 形状是:(309, 10)

我google了一下,实在找不到解决这个问题的答案。我不知道我的代码有什么问题。

实际上,您要检查的是 y_testmean_squared_errorpredicted_y

您必须检查您的模型在 x_test 上的预测,即预测:

predicted_y = model.predict(x_test)

然后可以计算误差:

mean_squared_error(y_test, predicted_y)

你的 y_test 数据形状是 (N, 1) 但因为你在输出层中放置了 10 个神经元,你的模型做出了 10 个不同的预测,这是错误的。

您需要将输出层中的神经元数量更改为 1 或添加一个只有 1 个神经元的新输出层。

下面的代码可能适合你。

import pandas as pd
from tensorflow.python.keras import Sequential
from tensorflow.python.keras.layers import Dense
from sklearn.model_selection import train_test_split

concrete_data = pd.read_csv('https://cocl.us/concrete_data')

n_cols = concrete_data.shape[1]
model = Sequential()
model.add(Dense(units=10, activation='relu', input_shape=(n_cols-1,)))           
model.add(Dense(units=1))
model.compile(loss='mean_squared_error',
          optimizer='adam')


y = concrete_data.Cement
x = concrete_data.drop('Cement', axis=1)
xTrain, xTest, yTrain, yTest = train_test_split(x, y, test_size = 0.3)

model.fit(xTrain, yTrain, epochs=50)
y_pred = model.predict(x_test).sum(axis=1)

试试这个,对我有用