IBM Bluemix - 视觉识别。为什么分数低？

IBM Bluemix - Visual Recognition. Why low scores?

我在 IBM Bluemix 上使用视觉识别服务。

我创建了一些分类器，特别是其中两个 objective:

首先：“通用”分类器必须 return 图像中特定对象识别的置信度分数。我用该对象的 50 个正面示例和与该对象相似的东西的 50 个负面示例（它的细节、它的组件、类似它的图像等）对其进行了训练。
第二个：如果第一个分类的分数很高，则更具体的分类器识别之前识别的对象的特定类型。这个新的分类器已经被训练成第一个：50 个 A 类对象的正例，50 个 B 类对象的负例。这第二个分类应该比第一个分类更具体，因为图像更详细并且它们之间都很相似。

结果是两个分类器的效果都很好，并且在大多数情况下，一组特定图像的预期结果与真实情况相对应，这应该意味着两者都经过了很好的训练。

但是有一点不明白

在两个分类器中，如果我尝试对已在正训练集中使用过的图像之一进行分类，我的期望是置信度分数应接近 90-100%。相反，我总是得到一个介于 0.50 和 0.55 之间的分数。当我尝试使用与正训练集之一（缩放、反射、剪切等）非常相似的图像时，也会发生同样的事情：置信度永远不会超过 0.55 左右。

我尝试用 100 张正面图像和 100 张负面图像创建一个类似的分类器，但最终结果从未改变。

问题是：为什么置信度得分这么低？为什么在正训练集中使用的图像不接近 90-100%？

Visual Recognition 自定义 classifiers 的分数范围从 0.0 到 1.0，但它们没有单位，不是百分比或概率。（它们加起来不等于 100% 或 1.0）

当服务根据您的示例创建 class 化器时，它会尝试找出 positive_examples 中一个 class 的特征与另一个 class 的 positive_examples（和 negative_examples，如果给定的话）。分数基于 class 的正例与 class 标识符中的所有其他示例之间的决策边界的距离。它尝试为每个 class 校准分数输出，以便 0.5 是一个不错的决策阈值，以说明某物是否属于 class。

但是，考虑到应用程序中误报与漏检的成本效益平衡，您可能希望使用更高或更低的阈值来确定图像是否属于 class。

在不知道你的 class 例子的细节的情况下，我可能猜想你的 class 之间有很多相似之处，可能在特征 space 你的例子中不在不同的集群中，并且分数反映了与边界的接近程度。

IBM Bluemix - 视觉识别。为什么分数低？

IBM Bluemix - Visual Recognition. Why low scores?

training-data

confidence-interval

ibm-watson

visual-recognition

ibm-cloud