在 Python 3 中提取 PDF 元数据
Extracting PDF metadata in Python 3
从 PDF 文件获取元数据的最佳模块或简单脚本是什么?
对于 python 2.7 来说,一切似乎都是如此,否则该模块将无法工作。
python 3.4.2 需要它才能工作。
https://pypi.python.org/pypi/pdfminer/ = Python 2.7
使用 PyPDF2:
与:print(input1.getDocumentInfo())
我不断收到错误消息:
raise utils.PdfReadError("file has not been decrypted")
PyPDF2.utils.PdfReadError: file has not been decrypted
有任何提示或帮助吗?
谢谢
从错误消息来看,您正在尝试读取加密的 PDF 文件。在您提供解密密码之前,您无法从该文件中获得任何信息。
如果您想要 pdfminer
的 Python 3 版本,请尝试 pdfminer3k
,它声称是 Python 3 端口。
从 PDF 文件获取元数据的最佳模块或简单脚本是什么? 对于 python 2.7 来说,一切似乎都是如此,否则该模块将无法工作。 python 3.4.2 需要它才能工作。
https://pypi.python.org/pypi/pdfminer/ = Python 2.7
使用 PyPDF2:
与:print(input1.getDocumentInfo())
我不断收到错误消息:
raise utils.PdfReadError("file has not been decrypted")
PyPDF2.utils.PdfReadError: file has not been decrypted
有任何提示或帮助吗?
谢谢
从错误消息来看,您正在尝试读取加密的 PDF 文件。在您提供解密密码之前,您无法从该文件中获得任何信息。
如果您想要 pdfminer
的 Python 3 版本,请尝试 pdfminer3k
,它声称是 Python 3 端口。