以下哪些 CNN 模型用于哪个计算机视觉任务?
Which of the following CNN models are used for which computer vision task?
我的分类正确吗?
LeNet-5:图像分类,
AlexNet:图像分类,
VGG-16:图像分类,
ResNet:图像分类,
Inception模块:图像分类,
MobileNet:图像分类,
EfficientNet:图像分类,
神经风格迁移:图像生成,
滑动Windows检测算法:物体检测,
R-CNN:目标检测,
YOLO:物体检测,
连体网络:图像识别,
U-Net:语义分割
如有错误,请指正。谢谢!
如果目的是 - 为什么最初发明它们,那么您的分类是正确的。然而,与基于任务的分类法不同,CNN 最好根据它们所做的不同进行研究。最初 CNN 是为图像分类而设计的,但同一个网络在最后一层稍作修改后就可用于对象检测。例如,Faster RCNN(专为对象检测而设计)可以使用任何专为分类设计的架构,例如 VGG、ResNet 等 (link). Similarly Faster-RCNN can be modified to do segmentation task in Mask-RCNN architecture (link)。
这是一张图表,显示了深度 CNN 的进化历史,展示了架构创新 (source)
这是另一个分类法,显示了基于架构风格的不同类别。
我的分类正确吗?
LeNet-5:图像分类,
AlexNet:图像分类,
VGG-16:图像分类,
ResNet:图像分类,
Inception模块:图像分类,
MobileNet:图像分类,
EfficientNet:图像分类,
神经风格迁移:图像生成,
滑动Windows检测算法:物体检测,
R-CNN:目标检测,
YOLO:物体检测,
连体网络:图像识别,
U-Net:语义分割
如有错误,请指正。谢谢!
如果目的是 - 为什么最初发明它们,那么您的分类是正确的。然而,与基于任务的分类法不同,CNN 最好根据它们所做的不同进行研究。最初 CNN 是为图像分类而设计的,但同一个网络在最后一层稍作修改后就可用于对象检测。例如,Faster RCNN(专为对象检测而设计)可以使用任何专为分类设计的架构,例如 VGG、ResNet 等 (link). Similarly Faster-RCNN can be modified to do segmentation task in Mask-RCNN architecture (link)。
这是一张图表,显示了深度 CNN 的进化历史,展示了架构创新 (source)
这是另一个分类法,显示了基于架构风格的不同类别。