Tesseract 盒子文件中的数字是多少?

What are the numbers in Tesseract box file?

看在我的份上,我找不到任何关于 Tesseract 盒子文件如何工作以及坐标代表什么的文档。

例如,我得到:

T 2768 165 2789 191 0

第一个标记显然是字符。我知道 Tesseract 使用左下角。 2768 因此应该是底部。第 4 个标记 (2789) 似乎在顶部。我不明白第三个 (165)、第五个 (191) 和第六个 (0) 标记是什么。 165191 是不正确的 left/right 坐标,0 我不知道它指的是什么。

谁能帮帮我?这些是像素坐标,还是我必须考虑图像的 DPI?

谢谢!

根据documentation,每行的格式是

<symbol> <left> <bottom> <right> <top> <page>

其中:

  • <symbol> 是字符,例如a 或 b.
  • <left> <bottom> <right> <top>是页面上适合字符的矩形坐标。请注意,Tesseract 使用的坐标系在图像的左下角为 (0,0)!
  • <page> 仅在您使用多页 TIFF 文件时才相关。在所有其他情况下,只需在此处输入 0。

所以在你的特定情况下

T 2768 165 2789 191 0

将是

  • 字符:T
  • 左:2768
  • 底部:165
  • 右:2789
  • 顶部:191
  • 页数:0