Keras 播种 ImageDataGenerator 与序列
Keras seeding ImageDataGenerator versus Sequence
我目前正在使用 tensorflow.keras.preprocessing.image.ImageDataGenerator
和 flow_from_directory
。例如:
from tensorflow.keras.preprocessing.image import ImageDataGenerator
train_datagen = ImageDataGenerator(rotation_range=20,
width_shift_range=0.1,
height_shift_range=0.1,
shear_range=0.2,
zoom_range=0.2,
fill_mode='nearest',
horizontal_flip=True,
rescale=1/255.0,
preprocessing_function=preprocessing_function,
data_format='channels_last')
train_generator = train_datagen.flow_from_directory(
directory=env.channel_dirs['train'],
target_size=(train_size, train_size),
color_mode="rgb",
batch_size=batch_size,
class_mode="categorical",
shuffle=True,
interpolation='bilinear',
seed=42)
我发现即使在 numpy 和 TensorFlow 中都设置了种子,批次顺序也不是静态的,所以我得不到可重现的结果。我看到了this post that recommends using a keras Sequence。但是,它只有一个小例子。
是否可以使 ImageDataGenerator 批量订单可重现?或者,有没有人有他们可以分享我如何使用 Sequence
但保留 flow_from_directory
以及使用 ImageDataGenerator
的扩充选项的示例?如果一个例子要求太多,总结如何去做也将不胜感激!
这里有一个nice-script,你也可以通过它来控制内部进程。这意味着,您可以定义自己在每次迭代中生成数据的方式,以及来自目录的流动数据。
我目前正在使用 tensorflow.keras.preprocessing.image.ImageDataGenerator
和 flow_from_directory
。例如:
from tensorflow.keras.preprocessing.image import ImageDataGenerator
train_datagen = ImageDataGenerator(rotation_range=20,
width_shift_range=0.1,
height_shift_range=0.1,
shear_range=0.2,
zoom_range=0.2,
fill_mode='nearest',
horizontal_flip=True,
rescale=1/255.0,
preprocessing_function=preprocessing_function,
data_format='channels_last')
train_generator = train_datagen.flow_from_directory(
directory=env.channel_dirs['train'],
target_size=(train_size, train_size),
color_mode="rgb",
batch_size=batch_size,
class_mode="categorical",
shuffle=True,
interpolation='bilinear',
seed=42)
我发现即使在 numpy 和 TensorFlow 中都设置了种子,批次顺序也不是静态的,所以我得不到可重现的结果。我看到了this post that recommends using a keras Sequence。但是,它只有一个小例子。
是否可以使 ImageDataGenerator 批量订单可重现?或者,有没有人有他们可以分享我如何使用 Sequence
但保留 flow_from_directory
以及使用 ImageDataGenerator
的扩充选项的示例?如果一个例子要求太多,总结如何去做也将不胜感激!
这里有一个nice-script,你也可以通过它来控制内部进程。这意味着,您可以定义自己在每次迭代中生成数据的方式,以及来自目录的流动数据。