计算机视觉 API 和自定义视觉 API 之间的差异

Difference between Computer Vision API and Custom Vision API

我对使用 Microsoft 的认知服务还很陌生。我想知道 MS Computer Vision API 和 MS Custom Vision API 有什么区别?

它们都处理图像上的计算机视觉,但希望我能帮助它们在这里更加区分。 :)

Computer Vision

计算机视觉 API 是 Microsoft 构建自己的图像模型的地方,可以为您提供一些东西:

  • 图像分类 - 这是 API 将为您提供许多对图像进行分类的标签的地方。它还应该为您提供模型预测图像属于该标签的强度的置信度分数。
  • 内容审核 - API 可以给你一个 isAdultisRacy 标志来确定图像是否符合这些标准。随附的置信度分数也与这些有关。
  • OCR - API 可以读取图像中的文本,并将文本提供给您。此 API 还可以处理手写文本,而不仅仅是标志上的文本。
  • 面部识别 - 此 API 将识别图像中名人或其他知名人士的面部。
  • 地标识别 - 这将识别图像中的地标。

Custom Vision

Custom Vision 服务略有不同,您可以根据 Microsoft 拥有的预建模型训练自己的图像模型。一方面,这只能做图像分类和物体检测。对象检测部分不仅会告诉您图像的标签,还会显示它在图像中的位置。目前,这部分服务处于预览阶段,但到目前为止我已经看到了不错的效果。

另一个区别是自定义视觉服务允许您上传自己的图像。对于图像分类,这意味着您可以上传图像,并为每张图像赋予一个或多个标签。因此,当您通过模型 运行 图像时,它会 return 它认为与标签的置信度得分一起的标签。对于对象检测,您执行相同的过程,但您选择要检测的对象所在的图像并为其添加标签。

每次上传和标记新图像时,都需要对模型进行训练。从那里您可以评估您的模型的性能,为其提供测试图像,甚至使用 REST URL 或 SDK 与其交互。

总而言之,两者之间最大的区别是Custom Vision服务只能进行图像分类和对象检测,以及将您自己的图像用于执行这些操作。计算机视觉 API 可以做得更多,但您无法控制模型的训练方式。

希望对您有所帮助!如果您有任何问题,请告诉我。