如何将 EMNIST 数据加载到 Tensorflow

How to load EMNIST data to Tensorflow

在我看过的所有关于 tensorflow 的教程中,他们都使用了 MNIST 数据集,我已经理解了建模,但我如何将这个数据集加载到 tensorflow 中? https://www.nist.gov/itl/iad/image-group/emnist-dataset

EMNIST dataset uses the same binary format as the original MNIST dataset。因此,您可以从任何使用原始 MNIST 数据集的教程中获取输入管道代码,并将其指向您通过下载 EMNIST 数据集获得的文件集,以在该数据集上进行训练。

您可以使用 scipy.io.loadmat() 加载 Matlab 格式的 EMNIST 数据文件。加载后必须旋转阵列。 GitHub 上有一个 Jupyter Notebook EMNIST Digits classification

您可以使用可在此处找到的 EMNIST 软件包:https://pypi.org/project/emnist/

要加载数据集,您首先需要决定要使用六个不同数据集中的哪一个。本文详情:https://arxiv.org/pdf/1702.05373v1.pdf

假设我们要使用 byclass 数据集:

from emnist import extract_training_samples, extract_test_samples
x_train, y_train = extract_training_samples('byclass')
x_test, y_test = extract_test_samples('byclass')