如何在训练神经网络后预测输入数据的准确性
How to predict the accuracy of input data after training a neural network
问题的本质:我想通过网上现成的例子来理解最简单的神经网络。我训练了它,然后我不明白如何在条件用户的输入数据上测试它的有效性。我在网上找到了model的函数:predict(), save(), loaded_model()。如果结果为 save() 和 loaded_model() 并且创建了文件夹“16_model”,则 predict() 会抛出错误。请告诉我如何使用它或如何在输入而不是测试数据上测试神经网络。
import keras
from keras.models import Sequential
from keras.layers import Dense
import numpy
numpy.random.seed(2)
dataset = numpy.loadtxt("diabet.csv", delimiter=",")
X, Y = dataset[:,0:8], dataset[:,8]
model = Sequential()
model.add(Dense(12, input_dim=8, activation='relu'))
model.add(Dense(10, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss="binary_crossentropy", optimizer="adam", metrics=['accuracy'])
model.fit(X, Y, epochs = 100, batch_size=10)
scores = model.evaluate(X, Y)
#model.save('16_model')
#model_loaded = keras.models.load_model('16_model')
print("\n%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))
您可以将数据集分成 training
和 testing
部分,如下所示,并使用 training set
训练模型和 test dataset
评估模型:
import pandas as pd
from sklearn.model_selection import train_test_split
dataset =pd.read_csv("/content/../diabetes.csv")#, delimiter=",")
dataset.head()
X = dataset.drop('Outcome', 1)
y = dataset['Outcome']
Y.shape
train_X, test_X, train_Y, test_Y=train_test_split(X,y, test_size=0.2)
train_X.shape
然后在使用train dataset
定义和训练模型后,您可以使用test dataset
评估模型。
model_loss, model_acc = model.evaluate(test_X, test_Y)
print("Model Accuracy", model_acc*100)
model.save('16_model')
model_loaded = keras.models.load_model('16_model')
输出:
5/5 [==============================] - 0s 2ms/step - loss: 0.5637 - accuracy: 0.7208
Model Accuracy 72.07792401313782
INFO:tensorflow:Assets written to: 16_model/assets
保存并加载相同的模型后再次评估模型,显示与之前保存模型相同的准确性。
model_loss, model_acc = model_loaded.evaluate(test_X, test_Y)
输出:
5/5 [==============================] - 0s 3ms/step - loss: 0.5637 - accuracy: 0.7208
这是预测部分:
(由于 sigmoid
函数用于二进制 class 化,这将显示 0 到 1 范围内的所有值)
pred=model_loaded.predict(train_X[:2])
print(pred))
输出:
[[0.925119 ]
[0.45006576]]
<0.5 的所有值都将归入 class 0,其余所有值将假定为 class 1。
for p in pred:
if p>=.5:
pred_class=1
else:
pred_class=0
print(pred_class)
输出:
1
0
你可以用实际标签验证这个预测:
train_Y[:2]
输出:
369 1
653 0
Name: Outcome, dtype: int64
问题的本质:我想通过网上现成的例子来理解最简单的神经网络。我训练了它,然后我不明白如何在条件用户的输入数据上测试它的有效性。我在网上找到了model的函数:predict(), save(), loaded_model()。如果结果为 save() 和 loaded_model() 并且创建了文件夹“16_model”,则 predict() 会抛出错误。请告诉我如何使用它或如何在输入而不是测试数据上测试神经网络。
import keras
from keras.models import Sequential
from keras.layers import Dense
import numpy
numpy.random.seed(2)
dataset = numpy.loadtxt("diabet.csv", delimiter=",")
X, Y = dataset[:,0:8], dataset[:,8]
model = Sequential()
model.add(Dense(12, input_dim=8, activation='relu'))
model.add(Dense(10, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss="binary_crossentropy", optimizer="adam", metrics=['accuracy'])
model.fit(X, Y, epochs = 100, batch_size=10)
scores = model.evaluate(X, Y)
#model.save('16_model')
#model_loaded = keras.models.load_model('16_model')
print("\n%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))
您可以将数据集分成 training
和 testing
部分,如下所示,并使用 training set
训练模型和 test dataset
评估模型:
import pandas as pd
from sklearn.model_selection import train_test_split
dataset =pd.read_csv("/content/../diabetes.csv")#, delimiter=",")
dataset.head()
X = dataset.drop('Outcome', 1)
y = dataset['Outcome']
Y.shape
train_X, test_X, train_Y, test_Y=train_test_split(X,y, test_size=0.2)
train_X.shape
然后在使用train dataset
定义和训练模型后,您可以使用test dataset
评估模型。
model_loss, model_acc = model.evaluate(test_X, test_Y)
print("Model Accuracy", model_acc*100)
model.save('16_model')
model_loaded = keras.models.load_model('16_model')
输出:
5/5 [==============================] - 0s 2ms/step - loss: 0.5637 - accuracy: 0.7208
Model Accuracy 72.07792401313782
INFO:tensorflow:Assets written to: 16_model/assets
保存并加载相同的模型后再次评估模型,显示与之前保存模型相同的准确性。
model_loss, model_acc = model_loaded.evaluate(test_X, test_Y)
输出:
5/5 [==============================] - 0s 3ms/step - loss: 0.5637 - accuracy: 0.7208
这是预测部分:
(由于 sigmoid
函数用于二进制 class 化,这将显示 0 到 1 范围内的所有值)
pred=model_loaded.predict(train_X[:2])
print(pred))
输出:
[[0.925119 ]
[0.45006576]]
<0.5 的所有值都将归入 class 0,其余所有值将假定为 class 1。
for p in pred:
if p>=.5:
pred_class=1
else:
pred_class=0
print(pred_class)
输出:
1
0
你可以用实际标签验证这个预测:
train_Y[:2]
输出:
369 1
653 0
Name: Outcome, dtype: int64