IBM PowerAI 愿景 | CLS 和 BBox 损失的技术描述是什么?
IBM PowerAI Vision | What are the technical description of CLS and BBox losses ?
我一直在 IBM PowerAI Vision 上训练对象检测模型。当我训练模型时,我看到以下明显的损失。我想用深度学习的术语来了解这些损失是什么。由于用于对象检测的损失有很多种。我最初的研究指向
- 交叉熵 = CLS 损失
- IoU 损失 = BBox 损失
但我不确定,文档对此没有太多说明。
- CLS = 分类、本地化、分割。代表
R-CNN 模型中的组合误差测量。显示准确度
经过训练的模型可以将原始图像分割成更小的区域,select
(定位)其中最有趣的对象并对发现的对象进行分类(如果
有的)。
- BBox = 边界框。测量经过训练的模型可以放置的精确程度
与测试子集相比,识别对象上的 bbox 坐标。
CLS 和 BBox 在训练时测量了几次,最后一个指定了结果错误级别。
有关详细信息和数学计算,请参阅 https://lilianweng.github.io/lil-log/2017/12/31/object-recognition-for-dummies-part-3.html
我一直在 IBM PowerAI Vision 上训练对象检测模型。当我训练模型时,我看到以下明显的损失。我想用深度学习的术语来了解这些损失是什么。由于用于对象检测的损失有很多种。我最初的研究指向
- 交叉熵 = CLS 损失
- IoU 损失 = BBox 损失
但我不确定,文档对此没有太多说明。
- CLS = 分类、本地化、分割。代表 R-CNN 模型中的组合误差测量。显示准确度 经过训练的模型可以将原始图像分割成更小的区域,select (定位)其中最有趣的对象并对发现的对象进行分类(如果 有的)。
- BBox = 边界框。测量经过训练的模型可以放置的精确程度 与测试子集相比,识别对象上的 bbox 坐标。
CLS 和 BBox 在训练时测量了几次,最后一个指定了结果错误级别。
有关详细信息和数学计算,请参阅 https://lilianweng.github.io/lil-log/2017/12/31/object-recognition-for-dummies-part-3.html