我是否需要微调 ResNet50 等最先进的 CNN 模型中的最后一个卷积层?
Do i Need to fine tune the last convolutional layers in a state of art CNN models like ResNet50?
我的毕业设计是在可以从胸部 X 光图像诊断 Covid-19 的 CNN 模型上使用迁移学习。在花了几天时间使用带有贝叶斯优化器的 Keras 调谐器库微调超参数,如全连接层数、层中节点数、学习率和丢弃率后,我得到了一些非常好的结果,测试多 class class化的准确率为 98%,二进制 class class化的准确率为 99%。但是,我冻结了原始基础模型中的所有层。在详尽的超参数优化之后,我只微调了最后一个全连接层。那里的大多数文章和论文都说他们对全连接层和一些卷积层进行了改进。难道我做错了什么?恐怕这好得令人难以置信。
我的数据集不是很大,只有 7000 张来自 Kaggle Covid-19 比赛的图像。
我在训练前对图像使用了 N-CLAHE 等图像增强技术,class化与不增强图像相比显着提高了准确性。
我对多个 State of art 模型(例如 VGG-16 和 ResNet50)进行了同样的操作,它们都给了我极好的结果。
如果你的意思是“只微调最后的全连接层”那么没有,你没有。
您可以选择微调您选择的任何层,但最重要的是模型的最后层,这就是您所做的,所以您可以开始了。
我的毕业设计是在可以从胸部 X 光图像诊断 Covid-19 的 CNN 模型上使用迁移学习。在花了几天时间使用带有贝叶斯优化器的 Keras 调谐器库微调超参数,如全连接层数、层中节点数、学习率和丢弃率后,我得到了一些非常好的结果,测试多 class class化的准确率为 98%,二进制 class class化的准确率为 99%。但是,我冻结了原始基础模型中的所有层。在详尽的超参数优化之后,我只微调了最后一个全连接层。那里的大多数文章和论文都说他们对全连接层和一些卷积层进行了改进。难道我做错了什么?恐怕这好得令人难以置信。
我的数据集不是很大,只有 7000 张来自 Kaggle Covid-19 比赛的图像。
我在训练前对图像使用了 N-CLAHE 等图像增强技术,class化与不增强图像相比显着提高了准确性。
我对多个 State of art 模型(例如 VGG-16 和 ResNet50)进行了同样的操作,它们都给了我极好的结果。
如果你的意思是“只微调最后的全连接层”那么没有,你没有。
您可以选择微调您选择的任何层,但最重要的是模型的最后层,这就是您所做的,所以您可以开始了。