Tesseract 盒子文件中的数字是多少?
What are the numbers in Tesseract box file?
看在我的份上,我找不到任何关于 Tesseract 盒子文件如何工作以及坐标代表什么的文档。
例如,我得到:
T 2768 165 2789 191 0
第一个标记显然是字符。我知道 Tesseract 使用左下角。 2768
因此应该是底部。第 4 个标记 (2789
) 似乎在顶部。我不明白第三个 (165
)、第五个 (191
) 和第六个 (0
) 标记是什么。 165
和 191
是不正确的 left/right 坐标,0
我不知道它指的是什么。
谁能帮帮我?这些是像素坐标,还是我必须考虑图像的 DPI?
谢谢!
根据documentation,每行的格式是
<symbol> <left> <bottom> <right> <top> <page>
其中:
<symbol>
是字符,例如a 或 b.
<left> <bottom> <right> <top>
是页面上适合字符的矩形坐标。请注意,Tesseract 使用的坐标系在图像的左下角为 (0,0)!
<page>
仅在您使用多页 TIFF 文件时才相关。在所有其他情况下,只需在此处输入 0。
所以在你的特定情况下
T 2768 165 2789 191 0
将是
- 字符:
T
- 左:
2768
- 底部:
165
- 右:
2789
- 顶部:
191
- 页数:
0
看在我的份上,我找不到任何关于 Tesseract 盒子文件如何工作以及坐标代表什么的文档。
例如,我得到:
T 2768 165 2789 191 0
第一个标记显然是字符。我知道 Tesseract 使用左下角。 2768
因此应该是底部。第 4 个标记 (2789
) 似乎在顶部。我不明白第三个 (165
)、第五个 (191
) 和第六个 (0
) 标记是什么。 165
和 191
是不正确的 left/right 坐标,0
我不知道它指的是什么。
谁能帮帮我?这些是像素坐标,还是我必须考虑图像的 DPI?
谢谢!
根据documentation,每行的格式是
<symbol> <left> <bottom> <right> <top> <page>
其中:
<symbol>
是字符,例如a 或 b.<left> <bottom> <right> <top>
是页面上适合字符的矩形坐标。请注意,Tesseract 使用的坐标系在图像的左下角为 (0,0)!<page>
仅在您使用多页 TIFF 文件时才相关。在所有其他情况下,只需在此处输入 0。
所以在你的特定情况下
T 2768 165 2789 191 0
将是
- 字符:
T
- 左:
2768
- 底部:
165
- 右:
2789
- 顶部:
191
- 页数:
0