tensorflow 模型可以在更高分辨率的图像上进行训练吗?

Can tensorflow models be trained on images with larger resolution?

需要帮助了解 Tensorflow 模型是否可以在更大的分辨率(如 4K 分辨率)上进行训练。我试过了,但训练没有开始,我希望是因为一些记忆问题。有人做过同样的工作吗?

理论上你可以,TensorFlow 没有任何限制阻止你这样做。

但实际上,限制是 GPU 或系统 RAM。一个 3840x2160 (4K) 的单通道浮点特征图大约需要 32 MB 的 RAM,通常卷积网络在每一层使用多个特征图,从 96 到 512。例如,128 个 4K 特征图需要大约 1 GB 的内存RAM,然后使用批处理进行训练并保留梯度计算的中间结果,将需要太多 RAM。

如果您查看普通 ImageNet 训练的神经网络的输入形状,尺寸通常为 224x224、256x256,而我见过的最大尺寸是 600x600,用于 SSD 和 Faster R-CNN 等对象检测网络。这些尺寸与完整的 4K 图像相去甚远。

TLDR。您应该将图像缩小到可管理的大小。