IBM Bluemix - 视觉识别。为什么分数低?

IBM Bluemix - Visual Recognition. Why low scores?

我在 IBM Bluemix 上使用视觉识别服务。

我创建了一些分类器,特别是其中两个 objective:

结果是两个分类器的效果都很好,并且在大多数情况下,一组特定图像的预期结果与真实情况相对应,这应该意味着两者都经过了很好的训练。

但是有一点不明白

在两个分类器中,如果我尝试对已在正训练集中使用过的图像之一进行分类,我的期望是置信度分数应接近 90-100%。相反,我总是得到一个介于 0.50 和 0.55 之间的分数。当我尝试使用与正训练集之一(缩放、反射、剪切等)非常相似的图像时,也会发生同样的事情:置信度永远不会超过 0.55 左右。

我尝试用 100 张正面图像和 100 张负面图像创建一个类似的分类器,但最终结果从未改变。

问题是:为什么置信度得分这么低?为什么在正训练集中使用的图像不接近 90-100%?

Visual Recognition 自定义 classifiers 的分数范围从 0.0 到 1.0,但它们没有单位,不是百分比或概率。 (它们加起来不等于 100% 或 1.0)

当服务根据您的示例创建 class 化器时,它会尝试找出 positive_examples 中一个 class 的特征与另一个 class 的 positive_examples(和 negative_examples,如果给定的话)。分数基于 class 的正例与 class 标识符中的所有其他示例之间的决策边界的距离。它尝试为每个 class 校准分数输出,以便 0.5 是一个不错的决策阈值,以说明某物是否属于 class。

但是,考虑到应用程序中误报与漏检的成本效益平衡,您可能希望使用更高或更低的阈值来确定图像是否属于 class。

在不知道你的 class 例子的细节的情况下,我可能猜想你的 class 之间有很多相似之处,可能在特征 space 你的例子中不在不同的集群中,并且分数反映了与边界的接近程度。