tess4j doOCR 中矩形的坐标是多少?

What are the coordinates of a rectangle in tess4j doOCR?

我正在尝试使用 tess4j 扫描多页 PDF 文件。我使用以下代码:

PdfUtilities.splitPdf(imageFile, outputFile, startPage, endPage);
List<IIOImage> imageList = ImageIOHelper.getIIOImageList(outputFile);
String result = instance.doOCR(imageList, null);

但是,由于速度问题,我只对扫描每页的上半部分(实际上,甚至更少,但为了争论)感兴趣。 API 指定我当前通过 null 的地方我可以通过 Rectangle rect,但我没有看到矩形坐标指的是什么。如果有任何区别,PDF 来自不同的提供商。

它指定图像边界内的区域,图像的左上角为 (0,0)。

http://tess4j.sourceforge.net/docs/docs-3.0/