愿景 API:不同的标签列表

Vision API: Differing tag-lists

计算机视觉 API 至少提供了两种获取图像标签的方法。

根据 the documentation,有一个 "description" 的标签列表,以及一个顶级 "tags" 列表。 "tags" 列表还包含置信度,"description tags" 列表没有。

但是,描述标签列表似乎比顶级标签列表详尽得多,通常显示的标签数量是顶级标签列表的 5 到 10 倍。

为什么有两个不同的标签列表?每个列表的用例是什么? 另外,描述标签列表显示的标签比顶级标签列表多是有原因的吗?

凭直觉,我会期待相反的情况,即基于主要标签列表的标签子集的描述

  "description": {
"tags": [
  "person",
  "man",
  "outdoor",
  "window",
  "glasses",
  [...]
],
---------
"tags": [
{
  "name": "person",
  "confidence": 0.98979085683822632
},
{
  "name": "man",
  "confidence": 0.94493889808654785
}

虽然今天的列表很相似,但现在或将来都不能保证这些列表会保持这种状态。描述中标签的想法是让 API 用户可以选择在自然语言句子的置信度较低的情况下使用这些标签构建他们喜欢的句子。

请注意,在标签和 description.tags 的情况下,术语都是按置信度降序排列的。

但为什么标签有置信度分数而 description.tags 没有?

另外我在一个回复中注意到他们有不同的第四元素。