在 Python 3 中提取 PDF 元数据

Question

从 PDF 文件获取元数据的最佳模块或简单脚本是什么？对于 python 2.7 来说，一切似乎都是如此，否则该模块将无法工作。 python 3.4.2 需要它才能工作。

https://pypi.python.org/pypi/pdfminer/ = Python 2.7

使用 PyPDF2：

与：print(input1.getDocumentInfo()) 我不断收到错误消息：

raise utils.PdfReadError("file has not been decrypted")
PyPDF2.utils.PdfReadError: file has not been decrypted

有任何提示或帮助吗？
谢谢

Answer 1

从错误消息来看，您正在尝试读取加密的 PDF 文件。在您提供解密密码之前，您无法从该文件中获得任何信息。

如果您想要 pdfminer 的 Python 3 版本，请尝试 pdfminer3k，它声称是 Python 3 端口。

Extracting PDF metadata in Python 3