如何将 TIFF 文件列表传递给 TessAPI1.TessBaseAPIProcessPages
How to pass a list of TIFF files to TessAPI1.TessBaseAPIProcessPages
我正在使用 Tesseract Java API (tess4J) 将 TIFF 文件转换为可读的 PDF。
当我只有一个源 TIFF 文件时,结果非常令人满意:
TessResultRenderer renderer = TessAPI1.TessPDFRendererCreate("outpath/my_new_pdf.pdf", dataPath, 0);
TessAPI1.TessResultRendererInsert(renderer, TessAPI1.TessPDFRendererCreate("output/my_new_pdf.pdf", dataPath, 0));
int result = TessAPI1.TessBaseAPIProcessPages(handle, sourceTiffFile.getAbsolutePath(), null, 0, renderer);
但是,API documentation 声明您应该能够提供文件列表以及单个文件:识别指定文件中的所有页面,作为多页 tiff 或文件名列表,或单张图像...
这会非常方便,因为我想传递几个 TIFFS 来生成多页 PDF,每个图像一页,但我还没有弄清楚如何传递列表图片。显而易见的第一次尝试是将逗号分隔的绝对文件路径列表传递给 TIFF,上面的示例传递了 sourceTiffFile.getAbsolutePath()
,但结果是一个非常小的、显然已损坏的 PDF 文件。
欢迎提出任何建议。
尝试一个文件列表,每个条目在单独的一行(即,由 \n 字符分隔)。
我正在使用 Tesseract Java API (tess4J) 将 TIFF 文件转换为可读的 PDF。
当我只有一个源 TIFF 文件时,结果非常令人满意:
TessResultRenderer renderer = TessAPI1.TessPDFRendererCreate("outpath/my_new_pdf.pdf", dataPath, 0);
TessAPI1.TessResultRendererInsert(renderer, TessAPI1.TessPDFRendererCreate("output/my_new_pdf.pdf", dataPath, 0));
int result = TessAPI1.TessBaseAPIProcessPages(handle, sourceTiffFile.getAbsolutePath(), null, 0, renderer);
但是,API documentation 声明您应该能够提供文件列表以及单个文件:识别指定文件中的所有页面,作为多页 tiff 或文件名列表,或单张图像...
这会非常方便,因为我想传递几个 TIFFS 来生成多页 PDF,每个图像一页,但我还没有弄清楚如何传递列表图片。显而易见的第一次尝试是将逗号分隔的绝对文件路径列表传递给 TIFF,上面的示例传递了 sourceTiffFile.getAbsolutePath()
,但结果是一个非常小的、显然已损坏的 PDF 文件。
欢迎提出任何建议。
尝试一个文件列表,每个条目在单独的一行(即,由 \n 字符分隔)。