如何在 Tabula 中指定从哪个目录获取文件 Java

How to specify which directory to get files from in Tabula Java

我在 python 中有这段代码,我用它打开子进程模块并继续从那里获取数据,但我不知道如何对来自不同目录的文件进行 OCR。我试过将完整的文件路径放到文件名应该在代码中的目录中,但它似乎没有用。如何在 Tabula 中指定从哪个目录获取文件?

var = ['java', '-jar', 'tabula-0.9.0-jar-with-dependencies.jar','-p', '1', '-a', '35, 0, 800, 800','-c', '25, 55, 85, 115, 145, 185, 339, 363, 530', file]

指定 PDF 文档的完整路径应该就足够了。此外,您可以考虑使用 tabula-pytabula-java 的 Python 包装器。