TensorFlow 中的网络架构

Network architecture in TensorFlow

我正在用 tensorflow 训练网络,但结果不够好。该模型无法概括,因此它只能检测每张图像的几个对象(框)。

根据以上内容,我不确定如何确定我的网络是否太 small/big 不适合我的目的。目前,我使用 Resnet101,但我不知道它是否真的适合我(我想检测 5 个对象 类),或者我是否应该换成 ResNet50 或 ResNet152 等。

有什么方法可以正确选择吗

谢谢。

在继续自己实施网络之前,您可以尝试将学习的预训练模型迁移到您的数据。

由于您要解决对象检测和分类问题。你可以看看一些流行的网络,比如 Faster RCNN 和 YOLO。

您自己训练的模型可能会出现很多问题,以下是我能想到的一些事情:

  1. 训练和测试数据分布不同
  2. 您的模型过度拟合您的训练数据,您可以尝试一些正则化方法来防止这种情况。
  3. 对几个时期进行超参数网格搜索,以找到学习率的最佳值,keep_prob,等等
  4. 没有足够的训练数据进行泛化。
  5. 至于网络大小,在您当前的训练装备上安装尽可能大的网络,然后开始减小其大小以找到准确性和计算强度之间的最佳平衡点。