read_pdf FileNotFoundError: [Errno 2] No such file or directory: in Python

read_pdf FileNotFoundError: [Errno 2] No such file or directory: in Python

我正在尝试使用 python 中的 read_pdf 从 pdf 中抓取表格。我正在使用 read_pdf 但它不起作用。另外,值得一提的是,我在 MAC 中使用 Jupiter notebook 执行此操作。 这就是我所做的:

from tabula import read_pdf
file = read_pdf(r'C:\Users\myname\Rprojects\Reports_scraping\data_scraped\icnarc_29052020\icnarc_200529.pdf')

我收到此错误:

FileNotFoundError: [Errno 2] No such file or directory: 'C:\Users\myname\Rprojects\Reports_scraping\data_scraped\icnarc_29052020\icnarc_200529.pdf'

我该如何解决这个问题?

只有一种可能,文件不存在,但你已经检查过我假设,如果没有,再次检查文件的拼写是否正确。如果这不起作用,请执行以下技巧

在与文件相同的文件夹中执行py代码,然后使用

from tabula import read_pdf
file = read_pdf(r'icnarc_200529.pdf')

有时,这个简单的方法就可以解决问题。

只是为了检查文件是否存在,当 运行 这个时你得到 True:

import os


file_path = r'C:\Users\myname\Rprojects\Reports_scraping\data_scraped\icnarc_29052020\icnarc_200529.pdf'
print( os.path.isfile(file_path))

在文件所在的位置编辑 file_path(使用 Python 3)。 您是否使用实际用户名更改了路径中的 "myname"...(以防万一)

最好使用 os.path.join 构建您的路径以使其兼容,在 windows 上需要创建根 "config.py" 文件,请参阅

#

与 GaB 讨论后,他似乎在 Mac 上使用 Jupyter notebook,这说明了问题,我看到了这个 link,但无能为力。

Jupyter - import pdf

os.path.join doc