在使用 TensorFlow 对象检测 API 训练 Mask RCNN 时,'loss' 是什么?
While training Mask RCNN using TensorFlow Object Detection API, what is the 'loss'?
我正在 TensorFlow 对象检测 中使用 Mask RCNN 训练 自定义对象检测。因此,我要预测对象实例掩码和边界框。
预训练模型:mask_rcnn_inception_v2_coco
以下是我训练的快照。
INFO:tensorflow:global step 4181: loss = 0.0031 (3.290 sec/step)
INFO:tensorflow:global step 4181: loss = 0.0031 (3.290 sec/step)
INFO:tensorflow:global step 4182: loss = 0.0030 (2.745 sec/step)
INFO:tensorflow:global step 4182: loss = 0.0030 (2.745 sec/step)
在这种情况下,你能告诉我这里的损失是多少吗?
我的问题与训练损失及其变化无关w.r.t。步骤。
我只是不清楚在训练 Mask RCNN 时这种损失是什么意思?在一个Mask RCNN中,最后一层有3个平行头,
- 用于检测class
- 用于预测边界框
- 用于预测实例掩码
这样的话,损失是多少?
Mask R-CNN 论文的损失函数结合了 3 个损失的加权和(3 个输出):class化、定位和分割掩码:

class化和边界框(定位)损失与 Faster R-CNN 相同。
添加的是掩码的每像素 sigmoid + 二进制损失。
mask 分支为每个 class 生成一个掩码,classes 之间没有竞争(所以如果你有 10 个 classes,mask 分支预测 10 个掩码)。使用的损失是每像素 sigmoid + 二进制损失。
如果您想更深入地研究掩码损失,该论文指出“多项式与独立掩码:掩码 R-CNN 解耦掩码和 class 预测:作为现有框
分支预测 class 标签,我们为每个标签生成一个掩码
class 在 classes 之间没有竞争(通过每像素 sigmoid 和二进制损失)。在 Table 2b 中,我们将其与
使用每像素 softmax 和多项式损失(在 FCN [30] 中常用)。"
您可以在第 6 页的 paper 中看到它,table 号 2.b ("Multinomial vs. Independent Masks")。
我正在 TensorFlow 对象检测 中使用 Mask RCNN 训练 自定义对象检测。因此,我要预测对象实例掩码和边界框。
预训练模型:mask_rcnn_inception_v2_coco
以下是我训练的快照。
INFO:tensorflow:global step 4181: loss = 0.0031 (3.290 sec/step)
INFO:tensorflow:global step 4181: loss = 0.0031 (3.290 sec/step)
INFO:tensorflow:global step 4182: loss = 0.0030 (2.745 sec/step)
INFO:tensorflow:global step 4182: loss = 0.0030 (2.745 sec/step)
在这种情况下,你能告诉我这里的损失是多少吗?
我的问题与训练损失及其变化无关w.r.t。步骤。
我只是不清楚在训练 Mask RCNN 时这种损失是什么意思?在一个Mask RCNN中,最后一层有3个平行头,
- 用于检测class
- 用于预测边界框
- 用于预测实例掩码
这样的话,损失是多少?
Mask R-CNN 论文的损失函数结合了 3 个损失的加权和(3 个输出):class化、定位和分割掩码:
class化和边界框(定位)损失与 Faster R-CNN 相同。
添加的是掩码的每像素 sigmoid + 二进制损失。 mask 分支为每个 class 生成一个掩码,classes 之间没有竞争(所以如果你有 10 个 classes,mask 分支预测 10 个掩码)。使用的损失是每像素 sigmoid + 二进制损失。
如果您想更深入地研究掩码损失,该论文指出“多项式与独立掩码:掩码 R-CNN 解耦掩码和 class 预测:作为现有框 分支预测 class 标签,我们为每个标签生成一个掩码 class 在 classes 之间没有竞争(通过每像素 sigmoid 和二进制损失)。在 Table 2b 中,我们将其与 使用每像素 softmax 和多项式损失(在 FCN [30] 中常用)。"
您可以在第 6 页的 paper 中看到它,table 号 2.b ("Multinomial vs. Independent Masks")。