`flow_from_dataframe()` 自定义预处理

`flow_from_dataframe()` custom pre-processing

我正在尝试使用 keras ImageDataGenerator.flow_from_dataframe() 方法动态生成图像数据,因为我正在处理的数据集太大,无法一次性加载到内存中。

源图像数据文件是DICOM文件,flow_from_dataframe()方法不支持。

是否可以(轻松)扩展 flow_from_dataframe() 以处理 DICOM(或其他不受支持的)images/input?

也许自定义预处理函数可以在每个不受支持的文件上 运行,返回规范化(windowed/photometric 更正)numpy 数组,然后允许 ImageDataGenerator 实例继续。

我可以在自己的安装上编辑源代码,但首选可以在 vanilla keras 上使用的通用解决方案,以确保可移植到其他平台(尤其是 Kaggle)!!

可以在 Keras github 问题 tracker/feature 请求中找到解决方案:https://github.com/keras-team/keras/issues/13665

可以基于 keras.utils.Sequence 作为超类创建自定义数据生成器。