Mask RCNN 使用什么样的图像进行训练(仅 8 位或 16 位图像或任何深度)?

What kind of image is used for training in Mask RCNN( only 8 bit or 16 bit images or any depth)?

我对用于训练目的的 MaskRCNN 图像有一点疑问。 MRCNN 是否只使用 8 位图像进行训练?如果它拍摄任何 16 位或 32 位图像,它将如何通过训练帮助我们? 通常可视化发生在 8 位图像上。如果它处理 16 位,我有一个进退两难的问题,它将如何帮助分类和映射。

只要您保持所有输入图像的数据类型相同且图像强度范围为 "consistent",就应该没问题。例如,如果我们更喜欢 8 位图像,则应将 16 位和 32 位图像重新缩放为 8 位,即输入图像的类型应为 uint8 - 值介于 [0,255] 之间。使用大多数机器学习模型进行训练和推理时需要这种类型的 "preprocessing"。

matterport/Mask_RCNN 的示例之一中,输入图像的类型为 uint8。

或者,为什么不将图像转换为 float 类型和范围 [0,1],从而保留 16 位和 32 位图像的像素分辨率?希望这有帮助。