Microsoft Azure 文本识别边界框响应中的 (X,Y) 坐标是什么单位?

What unit is (X,Y) coordinate in Microsoft Azure Text recognition bounding box response?

Microsoft Azure 文本识别边界框响应中的 (X,Y) 坐标是什么单位?

例如:

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          67,
          204,
          668,
          210,
          667,
          272,
          66,
          267
        ],
        "text": "Our greatest glory is not",
        ...

json 响应以顺时针方向显示边界框的四个坐标。但是,我还没有找到单位。我假设它是像素,但它没有写在任何地方...

API 可在此处获得:

https://westus.dev.cognitive.microsoft.com/docs/services/5adf991815e1060e6355ad44/operations/587f2cf1154055056008f201

它们是您假设的像素,尝试跟踪图像上 API 提供的坐标作为像素,您会发现自己在 API 检测到的每个对象周围绘制了一个矩形。

只要把你的图片想象成一个坐标平面,像素就是它的单位,这其实就是现实。