为什么我们需要像 yolo 这样的对象检测算法,而我们有像 deeplab_V3+ 这样的图像分割算法呢?

why do we need object detection algorithms like yolo while we have image segmentation algorithms like deeplab_V3+ which do the same?

我正在研究图像分割和对象检测,我认为它们做同样的事情(它们都在原始图片中定位和识别对象)。使用对象检测是否有任何好处,因为 deeplab_V3+ 比任何其他对象检测算法都具有更好的性能?

你可以在here

中查看deeplab_V3+演示

在物体检测中,该方法根据边界框坐标对图像中的物体进行定位和分类。然而,在图像分割中,该模型还会检测对象的精确边界,这通常会使速度变慢一些。他们都有自己的用途。在许多应用中(例如人脸检测),您只想检测图像中的某些特定对象,而不必关心它们的确切边界。但是在某些应用程序(例如医学图像)中,您需要肿瘤的确切边界。我们还可以考虑为这些任务准备数据的过程:

  • 分类:我们只为每张图片提供一个标签
  • 本地化:我们为每个图像提供一个边界框(4 个元素)
  • 检测:我们应该为每个对象提供一个边界框和一个标签
  • 分割:我们需要定义每个对象的准确边界(语义分割)

因此对于分割,在提供数据和训练(编码器-解码器)模型方面都需要做更多的工作,这取决于您的任务目的。