处理 TIF 文件 -- 将此转换从 ImageMagick 转换为 Java

Processing a TIF file -- Convert this transform from ImageMagick to Java

我正在尝试将 PDF 预处理为用于 OCR 的 TIF 图像。在命令行上,我可以通过使用以下 ImageMagick 命令将 PDF 转换为 TIF 来完成此操作:

$ convert -density 300 /path/to/my/document.pdf -depth 8 -strip -background white -alpha off file.tiff

如何在 Java 中获得相同的结果?我目前可以使用 tess4j 将 PDF 转换为 TIF,但如何重新缩放和预处理生成的 tif?哪些库可以让我快速轻松地做到这一点?

想通了。我没有尝试学习另一个图像预处理库,而是使用 im4java 扭曲 IM 命令行,然后直接将命令翻译为以下内容:

    ConvertCmd cmd = new ConvertCmd();

    IMOperation op = new IMOperation();
    op.addImage(imagePath);
    op.density(300);
    op.depth(8);
    op.strip();
    op.background("white");
    op.alpha("off");

    try {
        cmd.run(op);
    } catch (IOException e) {
        e.printStackTrace();
    } catch (InterruptedException e) {
        e.printStackTrace();
    } catch (IM4JavaException e) {
        e.printStackTrace();
    }