处理 TIF 文件 -- 将此转换从 ImageMagick 转换为 Java
Processing a TIF file -- Convert this transform from ImageMagick to Java
我正在尝试将 PDF 预处理为用于 OCR 的 TIF 图像。在命令行上,我可以通过使用以下 ImageMagick 命令将 PDF 转换为 TIF 来完成此操作:
$ convert -density 300 /path/to/my/document.pdf -depth 8 -strip -background white -alpha off file.tiff
如何在 Java 中获得相同的结果?我目前可以使用 tess4j 将 PDF 转换为 TIF,但如何重新缩放和预处理生成的 tif?哪些库可以让我快速轻松地做到这一点?
想通了。我没有尝试学习另一个图像预处理库,而是使用 im4java 扭曲 IM 命令行,然后直接将命令翻译为以下内容:
ConvertCmd cmd = new ConvertCmd();
IMOperation op = new IMOperation();
op.addImage(imagePath);
op.density(300);
op.depth(8);
op.strip();
op.background("white");
op.alpha("off");
try {
cmd.run(op);
} catch (IOException e) {
e.printStackTrace();
} catch (InterruptedException e) {
e.printStackTrace();
} catch (IM4JavaException e) {
e.printStackTrace();
}
我正在尝试将 PDF 预处理为用于 OCR 的 TIF 图像。在命令行上,我可以通过使用以下 ImageMagick 命令将 PDF 转换为 TIF 来完成此操作:
$ convert -density 300 /path/to/my/document.pdf -depth 8 -strip -background white -alpha off file.tiff
如何在 Java 中获得相同的结果?我目前可以使用 tess4j 将 PDF 转换为 TIF,但如何重新缩放和预处理生成的 tif?哪些库可以让我快速轻松地做到这一点?
想通了。我没有尝试学习另一个图像预处理库,而是使用 im4java 扭曲 IM 命令行,然后直接将命令翻译为以下内容:
ConvertCmd cmd = new ConvertCmd();
IMOperation op = new IMOperation();
op.addImage(imagePath);
op.density(300);
op.depth(8);
op.strip();
op.background("white");
op.alpha("off");
try {
cmd.run(op);
} catch (IOException e) {
e.printStackTrace();
} catch (InterruptedException e) {
e.printStackTrace();
} catch (IM4JavaException e) {
e.printStackTrace();
}