使用机器学习计算图像中的车辆数量

Counting the number of vehicles from an image with machine learning

我是机器学习的新手。我的任务是使用机器学习概念从图像中查找车辆总数。我正在使用神经网络。此处给出了我的最坏情况图像。

Traffic Image

我需要从这张图片中找出汽车的总数。我的想法是将这张大图像切割成小块图像,并训练网络从小块中计算车辆数量。每个补丁的数量将少于 5。然后在处理新图像时,我可以使用滑动 window 来获取车辆总数。

我只想知道这个想法是否可行,或者我是否应该使用这些特征进行特征提取和训练神经网络。如果可以的话,数据集和训练有没有条件。

您要查找的内容称为对象检测。起点可以是 Deep Neural Networks for Object Detection or Region-based Convolutional Networks for Accurate Object Detection and Segmentation.

一个类似但困难得多的任务是实例分割。我在该领域看到的最新论文之一是 Pixel-level Encoding and Depth Layering for Instance-level Semantic Labeling

实例分割可能是计算机视觉中最难的任务。当您不熟悉机器学习/计算机视觉时,您可能首先想进行图像分类。如果想往instance segmentation的方向走,那就继续semantic segmentation,然后instance segmentation。

一个简单的滑动 window 方法,你只预测 "car" / "no car" 是行不通的,因为在图像中汽车没有被任何 "no car" 分开.