TensorFlow 中的网络架构
Network architecture in TensorFlow
我正在用 tensorflow 训练网络,但结果不够好。该模型无法概括,因此它只能检测每张图像的几个对象(框)。
根据以上内容,我不确定如何确定我的网络是否太 small/big 不适合我的目的。目前,我使用 Resnet101,但我不知道它是否真的适合我(我想检测 5 个对象 类),或者我是否应该换成 ResNet50 或 ResNet152 等。
有什么方法可以正确选择吗
谢谢。
在继续自己实施网络之前,您可以尝试将学习的预训练模型迁移到您的数据。
由于您要解决对象检测和分类问题。你可以看看一些流行的网络,比如 Faster RCNN 和 YOLO。
您自己训练的模型可能会出现很多问题,以下是我能想到的一些事情:
- 训练和测试数据分布不同
- 您的模型过度拟合您的训练数据,您可以尝试一些正则化方法来防止这种情况。
- 对几个时期进行超参数网格搜索,以找到学习率的最佳值,keep_prob,等等
- 没有足够的训练数据进行泛化。
- 至于网络大小,在您当前的训练装备上安装尽可能大的网络,然后开始减小其大小以找到准确性和计算强度之间的最佳平衡点。
我正在用 tensorflow 训练网络,但结果不够好。该模型无法概括,因此它只能检测每张图像的几个对象(框)。
根据以上内容,我不确定如何确定我的网络是否太 small/big 不适合我的目的。目前,我使用 Resnet101,但我不知道它是否真的适合我(我想检测 5 个对象 类),或者我是否应该换成 ResNet50 或 ResNet152 等。
有什么方法可以正确选择吗
谢谢。
在继续自己实施网络之前,您可以尝试将学习的预训练模型迁移到您的数据。
由于您要解决对象检测和分类问题。你可以看看一些流行的网络,比如 Faster RCNN 和 YOLO。
您自己训练的模型可能会出现很多问题,以下是我能想到的一些事情:
- 训练和测试数据分布不同
- 您的模型过度拟合您的训练数据,您可以尝试一些正则化方法来防止这种情况。
- 对几个时期进行超参数网格搜索,以找到学习率的最佳值,keep_prob,等等
- 没有足够的训练数据进行泛化。
- 至于网络大小,在您当前的训练装备上安装尽可能大的网络,然后开始减小其大小以找到准确性和计算强度之间的最佳平衡点。