将图像数据集加载到 pytorch 中的数据加载器后,如何将其下载到我的电脑?

How can I download to my pc an image dataset after loading it into a dataloader in pytorch?

我一直在关注这篇文章: https://github.com/moein-shariatnia/Deep-Learning/tree/main/Image%20Colorization%20Tutorial

我有一个问题。我正在尝试下载已加载到 pytorch 数据加载器中的图像,但由于它们是从更大的数据集中随机选择的,所以我无法弄清楚。 如何在选择图像后将我加载到“train_dl”中的确切图像下载到我的电脑(作为文件夹)?我已经在这些精确的图像上训练了我的模型,所以我将需要它们用于未来的工作。

数据加载器应该有一个数据集属性,您可以使用它来查找代码中的路径

代码中:

class ColorizationDataset(Dataset):
    def __init__(self, paths, split='train'):
        ...
        
        self.split = split
        self.size = SIZE
        self.paths = paths #<<<<- IMPORTANT LINE HERE
    
    def __getitem__(self, idx):
        ...
    
    def __len__(self):
        return len(self.paths)

def make_dataloaders(batch_size=16, n_workers=4, pin_memory=True, **kwargs): # A handy function to make our dataloaders
    dataset = ColorizationDataset(**kwargs)
    dataloader = DataLoader(dataset, batch_size=batch_size, num_workers=n_workers,
                            pin_memory=pin_memory)
    return dataloader

因此,要从您的数据加载器中获取项目,您可以 运行:

train_paths = train_dl.dataset.paths

您可以遍历此列表以单独保存图像(不推荐)或仅将其保存为文本并将 train/val/test 拆分为单独的文件。