KITTI 上的对象检测（奇怪的纵横比）

Object Detection on KITTI (strange aspect ratio)

我正在尝试在 KITTI 数据集上训练任何物体检测器，它具有奇怪的纵横比 ~370 高度和 1240 宽度。在开始对模型动物园中的任何模型进行微调后，我无法获得良好的检测结果。我采用了示例 coco 配置，只是将图像缩放器参数更改为输入图像大小，并将类的数量更改为 4.

我首先按照教程中的指示创建数据集的 TFRecord 文件，并检查了该文件以确认图像、标签和其他信息已正确保存为二进制格式，因此数据集不是问题。

当我使用动物园的模型进行评估时，我得到了不错的检测结果。然而，一旦我尝试在我自己训练的模型上进行评估，检测结果就很糟糕并且遍布整个图像。对于 ssd ~.4 和 rfcn ~.0004，训练期间的损失也极低。我认为这与图像大小有关，但我不确定。有谁知道为什么在新数据集上的检测最终会如此糟糕？

下面是我从ssd模型中得到的bounding boxes的类型示例：

示例检测

我的问题出在 TFRecord 文件上。边界框坐标和标签有错误的键，因此网络是在没有边界框的 "empty" 图像上训练的。这也解释了为什么我的错误会收敛到 0，因为网络的权重只是被正则化压缩而没有从定位中损失以形成梯度。