KITTI 上的对象检测(奇怪的纵横比)
Object Detection on KITTI (strange aspect ratio)
我正在尝试在 KITTI 数据集上训练任何物体检测器,它具有奇怪的纵横比 ~370 高度和 1240 宽度。在开始对模型动物园中的任何模型进行微调后,我无法获得良好的检测结果。我采用了示例 coco 配置,只是将图像缩放器参数更改为输入图像大小,并将 类 的数量更改为 4.
我首先按照教程中的指示创建数据集的 TFRecord 文件,并检查了该文件以确认图像、标签和其他信息已正确保存为二进制格式,因此数据集不是问题。
当我使用动物园的模型进行评估时,我得到了不错的检测结果。然而,一旦我尝试在我自己训练的模型上进行评估,检测结果就很糟糕并且遍布整个图像。对于 ssd ~.4 和 rfcn ~.0004,训练期间的损失也极低。我认为这与图像大小有关,但我不确定。有谁知道为什么在新数据集上的检测最终会如此糟糕?
下面是我从ssd模型中得到的bounding boxes的类型示例:
示例检测
我的问题出在 TFRecord 文件上。边界框坐标和标签有错误的键,因此网络是在没有边界框的 "empty" 图像上训练的。这也解释了为什么我的错误会收敛到 0,因为网络的权重只是被正则化压缩而没有从定位中损失以形成梯度。
我正在尝试在 KITTI 数据集上训练任何物体检测器,它具有奇怪的纵横比 ~370 高度和 1240 宽度。在开始对模型动物园中的任何模型进行微调后,我无法获得良好的检测结果。我采用了示例 coco 配置,只是将图像缩放器参数更改为输入图像大小,并将 类 的数量更改为 4.
我首先按照教程中的指示创建数据集的 TFRecord 文件,并检查了该文件以确认图像、标签和其他信息已正确保存为二进制格式,因此数据集不是问题。
当我使用动物园的模型进行评估时,我得到了不错的检测结果。然而,一旦我尝试在我自己训练的模型上进行评估,检测结果就很糟糕并且遍布整个图像。对于 ssd ~.4 和 rfcn ~.0004,训练期间的损失也极低。我认为这与图像大小有关,但我不确定。有谁知道为什么在新数据集上的检测最终会如此糟糕?
下面是我从ssd模型中得到的bounding boxes的类型示例:
示例检测
我的问题出在 TFRecord 文件上。边界框坐标和标签有错误的键,因此网络是在没有边界框的 "empty" 图像上训练的。这也解释了为什么我的错误会收敛到 0,因为网络的权重只是被正则化压缩而没有从定位中损失以形成梯度。