以下哪些 CNN 模型用于哪个计算机视觉任务?

Which of the following CNN models are used for which computer vision task?

我的分类正确吗?

LeNet-5:图像分类,
AlexNet:图像分类,
VGG-16:图像分类,
ResNet:图像分类,
Inception模块:图像分类,
MobileNet:图像分类,
EfficientNet:图像分类,
神经风格迁移:图像生成,
滑动Windows检测算法:物体检测,
R-CNN:目标检测,
YOLO:物体检测,
连体网络:图像识别,
U-Net:语义分割

如有错误,请指正。谢谢!

如果目的是 - 为什么最初发明它们,那么您的分类是正确的。然而,与基于任务的分类法不同,CNN 最好根据它们所做的不同进行研究。最初 CNN 是为图像分类而设计的,但同一个网络在最后一层稍作修改后就可用于对象检测。例如,Faster RCNN(专为对象检测而设计)可以使用任何专为分类设计的架构,例如 VGG、ResNet 等 (link). Similarly Faster-RCNN can be modified to do segmentation task in Mask-RCNN architecture (link)。

这是一张图表,显示了深度 CNN 的进化历史,展示了架构创新 (source)

这是另一个分类法,显示了基于架构风格的不同类别。