如何使用 Python 在 Keras 中加载数据集?

How to load dataset for in Keras using Python?

我是使用 Python 学习 Keras 的初学者。

我已经阅读了一些使用 MNIST 数据集加载数据集的示例代码。

我不明白变量 (X_train, y_train) 和 (X_test, y_test).

请帮我解释一下这些变量的用途。

此外,分配给这些变量的数据类型是什么?

from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense
from keras.utils import np_utils

# Load data
(X_train, y_train), (X_test, y_test) = mnist.load_data()

Mnist 数据集包含大约 75 000 张手写数字样本图像。每个数字还带有一个标签,其中包含可以在图像中看到的数字。每个图像的大小为 28x28 像素。这些图像被分成两部分。 training-ImagesTest-Images。您使用 training-images 来训练您的模型。然后你通过测试生成的神经元网络在直到那时未使用和看不见的 test-images.

上的工作情况来验证你的 accuracyloss

(X_train, Y_train) 是一个元组,两个值的组合存储在一个 variable/list-element...

然后图像作为数组存储在这些列表中。所以 X_train 包含大约 60 000 个大小为 784 (28*28) 的数组。每个单元格代表一个像素的值。它可以是从 0(白色)到 255(黑色)的任何值

X_test 包含一个包含大约 15 000 个此类数组的列表。适合图像的Labels存储在属于Y_train/Y_test

根据 keras documentation:

x_train, x_test: uint8 array of grayscale image data with shape (num_samples, 28, 28).

y_train, y_test: uint8 array of digit labels (integers in range 0-9) with shape (num_samples,).

x_trainy_train分别是训练的特征和标签。 x_testy_test分别是用于测试的特征和标签。