TF 对象检测的最佳实践 API 非常大的图像
Best practice for TF Object Detection API for very large images
Tensorflow Object Detection API offers a variety of models。这些以 600x600 图像大小进行训练。假设我有一张 6000x4000 的卫星图像,我想在整个图像中连续检测物体。使 TFODI 模型适应此图像大小的最佳做法是什么?我不关心每张图像用于对象检测的 运行 时间。我有一个 9GB RAM 的 GPU。
我知道我可以将单个 6000x4000 图像放入此 GPU。我不确定我是否可以将那个尺寸的图像处理神经网络安装到 GPU 上。我可以想到几个替代方案:
将图像分割成 600x600 的块,这可能会丢失跨块的特征,但是一切都应该开箱即用。
将模型定义中的图像尺寸从 600x600 更改为 6000x4000。我可以从 Model Zoo 检查点重新训练吗,或者如果我这样做我必须从头开始吗?
将图像压缩到更小的尺寸。这会扭曲图像尺寸并丢失特征细节。比方说一张城市的照片,由此产生的细节不足以挑出汽车和小房子。
您需要尝试不同的尺寸,看看在训练期间使用什么尺寸不会 运行 内存不足。内存消耗还取决于您正在训练的图像数量。根据您的描述,您最终将使用中间尺寸的图像
Tensorflow Object Detection API offers a variety of models。这些以 600x600 图像大小进行训练。假设我有一张 6000x4000 的卫星图像,我想在整个图像中连续检测物体。使 TFODI 模型适应此图像大小的最佳做法是什么?我不关心每张图像用于对象检测的 运行 时间。我有一个 9GB RAM 的 GPU。 我知道我可以将单个 6000x4000 图像放入此 GPU。我不确定我是否可以将那个尺寸的图像处理神经网络安装到 GPU 上。我可以想到几个替代方案:
将图像分割成 600x600 的块,这可能会丢失跨块的特征,但是一切都应该开箱即用。
将模型定义中的图像尺寸从 600x600 更改为 6000x4000。我可以从 Model Zoo 检查点重新训练吗,或者如果我这样做我必须从头开始吗?
将图像压缩到更小的尺寸。这会扭曲图像尺寸并丢失特征细节。比方说一张城市的照片,由此产生的细节不足以挑出汽车和小房子。
您需要尝试不同的尺寸,看看在训练期间使用什么尺寸不会 运行 内存不足。内存消耗还取决于您正在训练的图像数量。根据您的描述,您最终将使用中间尺寸的图像