Keras 播种 ImageDataGenerator 与序列

Keras seeding ImageDataGenerator versus Sequence

我目前正在使用 tensorflow.keras.preprocessing.image.ImageDataGeneratorflow_from_directory。例如:

from tensorflow.keras.preprocessing.image import ImageDataGenerator

 train_datagen = ImageDataGenerator(rotation_range=20,
                                    width_shift_range=0.1,
                                    height_shift_range=0.1,
                                    shear_range=0.2, 
                                    zoom_range=0.2, 
                                    fill_mode='nearest', 
                                    horizontal_flip=True,
                                    rescale=1/255.0, 
                                    preprocessing_function=preprocessing_function, 
                                    data_format='channels_last')

train_generator = train_datagen.flow_from_directory(
    directory=env.channel_dirs['train'],
    target_size=(train_size, train_size),
    color_mode="rgb",
    batch_size=batch_size,
    class_mode="categorical",
    shuffle=True,
    interpolation='bilinear',
    seed=42)

我发现即使在 numpy 和 TensorFlow 中都设置了种子,批次顺序也不是静态的,所以我得不到可重现的结果。我看到了this post that recommends using a keras Sequence。但是,它只有一个小例子。

是否可以使 ImageDataGenerator 批量订单可重现?或者,有没有人有他们可以分享我如何使用 Sequence 但保留 flow_from_directory 以及使用 ImageDataGenerator 的扩充选项的示例?如果一个例子要求太多,总结如何去做也将不胜感激!

这里有一个nice-script,你也可以通过它来控制内部进程。这意味着,您可以定义自己在每次迭代中生成数据的方式,以及来自目录的流动数据。