Tabula-Py 不工作 - 调用过程错误 - 非零退出状态 1

Tabula-Py not working - Called Process Error - non-zero exit status 1

我正在尝试使用 Tabula-py 从 PDF 中抓取一些数据,但是我无法让它正常工作。我在我的 Jupyter 笔记本中 运行 这个(在 Mac 上):

from tabula import read_pdf
df = read_pdf("/Users/jamesozden/Downloads/pdfminer-20140328/samples/simple1.pdf")

我收到这个错误:

Error: 
---------------------------------------------------------------------------
CalledProcessError                        Traceback (most recent call last)
<ipython-input-5-57f646d3a440> in <module>()
----> 1 df = read_pdf("/Users/jamesozden/Downloads/pdfminer-20140328/samples/simple1.pdf")
      2 #/Users/jamesozden/Desktop/data_scrape_table.pdf

/Users/jamesozden/anaconda/lib/python2.7/site-packages/tabula/wrapper.pyc in read_pdf(input_path, output_format, encoding, java_options, pandas_options, multiple_tables, **kwargs)
     83 
     84     try:
---> 85         output = subprocess.check_output(args)
     86 
     87     except FileNotFoundError as e:

/Users/jamesozden/anaconda/lib/python2.7/subprocess.pyc in check_output(*popenargs, **kwargs)
    217         if cmd is None:
    218             cmd = popenargs[0]
--> 219         raise CalledProcessError(retcode, cmd, output=output)
    220     return output
    221 

CalledProcessError: Command '['java', '-jar', '/Users/jamesozden/anaconda/lib/python2.7/site-packages/tabula/tabula-1.0.1-jar-with-dependencies.jar', '--pages', '1', '--guess', '/Users/jamesozden/Downloads/pdfminer-20140328/samples/simple1.pdf']' returned non-zero exit status 1

所以我阅读了一些关于安装 java 的问题,我确实这样做了。我还确保我将路径添加到我的 bash 配置文件中(我对此比较陌生,所以我不确定我是否正确完成了)。这是我添加到我的 bash.profile 中的行,以防有人想确保它没问题,这是我使用 which java:

得到的
export PATH="$HOME/usr/bin/java/bin:$PATH"

任何帮助将不胜感激,谢谢!

我自己整理好了!事实证明,即使我已经下载了 Java 的更新版本,1.6 版还是正在使用的版本(这个使用 java 版本)。我用自制软件升级到 java 8,现在工作正常。