正在 Python 中将数据加载到训练集中

Loading data into training set in Python

我需要为我的 2 个目录中的所有文件创建训练集和测试集。但是我只能 select 一个文件。如何浏览所有 .npz 文件?

图像存储在图像文件夹中,格式如下:[patient_id].npz。每个 .npz 文件都包含扫描和掩码(3 维数组),可通过 :

访问
import numpy as np

archive = np.load('Train set/Images/patient_002.npz')
train_scan = archive['scan']
train_mask = archive['mask']

test_set = np.load('Test set/Images/patient_000.npz')
test_scan = test_set['scan']
test_mask = test_set['mask']

将test_scan.shape和train_mask.shape作为3d矩阵:

输出:

(92, 92, 92)

您可以使用 os.walk.

import os
all_files = []
for _, _, file_name in os.walk('Train set/Images/'):
    all_files.extend(file_name)

all_files = [file_name for file_name in all_files if file_name.endswith('.npz')]

然后你可以在 for 循环中读取 all_files。希望这有帮助。