如何使用 Python 获取 PDF 文件元数据 'Page Size'?
How to get PDF file metadata 'Page Size' using Python?
我尝试在 Python 3 中使用 PyPDF2 模块,但我无法显示 'Page Size' 属性。
我想知道在扫描到 PDF 文件之前纸张尺寸的 sheet 是多少。
像这样:
import PyPDF2
pdf=PdfFileReader("sample.pdf","rb")
print(pdf.getNumPages())
但我正在寻找另一个 Python 函数,而不是例如 getNumPages()...
下面的命令打印某种元数据但没有页面大小:
pdf_info=pdf.getDocumentInfo()
print(pdf_info)
此代码应该可以帮助您:
import PyPDF2
pdf = PyPDF2.PdfFileReader("a.pdf","rb")
p = pdf.getPage(1)
w_in_user_space_units = p.mediaBox.getWidth()
h_in_user_space_units = p.mediaBox.getHeight()
# 1 user space unit is 1/72 inch
# 1/72 inch ~ 0.352 millimeters
w = float(p.mediaBox.getWidth()) * 0.352
h = float(p.mediaBox.getHeight()) * 0.352
我尝试在 Python 3 中使用 PyPDF2 模块,但我无法显示 'Page Size' 属性。 我想知道在扫描到 PDF 文件之前纸张尺寸的 sheet 是多少。
像这样:
import PyPDF2
pdf=PdfFileReader("sample.pdf","rb")
print(pdf.getNumPages())
但我正在寻找另一个 Python 函数,而不是例如 getNumPages()...
下面的命令打印某种元数据但没有页面大小:
pdf_info=pdf.getDocumentInfo()
print(pdf_info)
此代码应该可以帮助您:
import PyPDF2
pdf = PyPDF2.PdfFileReader("a.pdf","rb")
p = pdf.getPage(1)
w_in_user_space_units = p.mediaBox.getWidth()
h_in_user_space_units = p.mediaBox.getHeight()
# 1 user space unit is 1/72 inch
# 1/72 inch ~ 0.352 millimeters
w = float(p.mediaBox.getWidth()) * 0.352
h = float(p.mediaBox.getHeight()) * 0.352