无需下载即可创建 Pytorch 数据集

create Pytorch dataset without downloading

这里很新,希望这不是一个简单的问题。 我正在尝试进入深度学习,从 pytorch.

开始

事实是,我看到的所有教程都使用下载来构建用于训练和测试的数据集。不幸的是,我的互联网连接受到限制,这意味着我无法直接从网络上下载。 我可以做的是下载文件并将它们传输到我的计算机中。

所以我的问题是 - 为了在 pytorch 中使用之前下载的数据集:

  1. 我应该把它存放在哪里?
  2. 我的计算机上有文件后如何创建数据集?

如果有任何其他信息对您来说很重要,我会很高兴听到,我是一个认真的新手..

非常感谢!

不确定您要的是哪个数据集。由于您提到了“教程”,我猜您只想使用 PyTorch 生态系统中某些库附带的数据集(例如 torchvision)。

Dataset PyTorch 生态系统中的类在其构造函数中有一个“root”参数。

mnist = MNIST(root='/some/path', download=True)

您可以简单地在有互联网的机器上下载它,然后将文件夹 /some/path 的内容传输到您位于 /my/machine/path 的机器上。只需指向它并关闭下载

# on your machine without internet
mnist = MNIST(root='/my/machine/path', download=False)

这应该有效。