使用机器学习计算图像中的车辆数量

Counting the number of vehicles from an image with machine learning

我是机器学习的新手。我的任务是使用机器学习概念从图像中查找车辆总数。我正在使用神经网络。此处给出了我的最坏情况图像。

我需要从这张图片中找出汽车的总数。我的想法是将这张大图像切割成小块图像，并训练网络从小块中计算车辆数量。每个补丁的数量将少于 5。然后在处理新图像时，我可以使用滑动 window 来获取车辆总数。

我只想知道这个想法是否可行，或者我是否应该使用这些特征进行特征提取和训练神经网络。如果可以的话，数据集和训练有没有条件。

一个类似但困难得多的任务是实例分割。我在该领域看到的最新论文之一是 Pixel-level Encoding and Depth Layering for Instance-level Semantic Labeling。

实例分割可能是计算机视觉中最难的任务。当您不熟悉机器学习/计算机视觉时，您可能首先想进行图像分类。如果想往instance segmentation的方向走，那就继续semantic segmentation，然后instance segmentation。

一个简单的滑动 window 方法，你只预测 "car" / "no car" 是行不通的，因为在图像中汽车没有被任何 "no car" 分开.