python pdf(PyPDF2 模块)- 如何 split/merge 这个?
python pdf (PyPDF2 module) - How to split/merge this?
我试图拆分和合并 pdf 文件,以便我可以删除每个 pdf 文件的第一页。这是代码。
#python3
#split and merge pdf files!
import os, PyPDF2
pdfFiles = []
os.chdir('C:\Users\Cyber\Downloads\5-111-fall-2008\5-111-fall-2008\contents\readings-and-lecture-notes')
for filename in os.listdir('.'):
if filename.endswith('pdf'):
pdfFiles.append(filename)
pdfWriter = PyPDF2.PdfFileWriter()
for filename in pdfFiles:
pdfFileObj = open(filename, 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
for pageNum in range(1, pdfReader.numPages):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open('Merged.pdf', 'wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()
然后我得到以下错误...
: PdfReadWarning: Xref table 不是零索引。对象的 ID 号将得到更正。 [pdf.py:1736]
我搜索了那个错误,发现它表明 PDF 本身的创建可能存在问题。
虽然我得到了我想要的 merged.pdf 文件,但我想知道这到底意味着什么以及如何避免得到它们。
此警告意味着外部参照的第一部分 table 不以对象零开头。编写 PDF 时可能有错误。如果 strict = False,PyPDF2 将尝试更正对象 ID 号。如果 strict = True,它们将不会 corrected.The 默认为 True。尝试 PyPDF2.PdfFileReader(pdfFileObj,False)
我试图拆分和合并 pdf 文件,以便我可以删除每个 pdf 文件的第一页。这是代码。
#python3
#split and merge pdf files!
import os, PyPDF2
pdfFiles = []
os.chdir('C:\Users\Cyber\Downloads\5-111-fall-2008\5-111-fall-2008\contents\readings-and-lecture-notes')
for filename in os.listdir('.'):
if filename.endswith('pdf'):
pdfFiles.append(filename)
pdfWriter = PyPDF2.PdfFileWriter()
for filename in pdfFiles:
pdfFileObj = open(filename, 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
for pageNum in range(1, pdfReader.numPages):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open('Merged.pdf', 'wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()
然后我得到以下错误...
: PdfReadWarning: Xref table 不是零索引。对象的 ID 号将得到更正。 [pdf.py:1736]
我搜索了那个错误,发现它表明 PDF 本身的创建可能存在问题。
虽然我得到了我想要的 merged.pdf 文件,但我想知道这到底意味着什么以及如何避免得到它们。
此警告意味着外部参照的第一部分 table 不以对象零开头。编写 PDF 时可能有错误。如果 strict = False,PyPDF2 将尝试更正对象 ID 号。如果 strict = True,它们将不会 corrected.The 默认为 True。尝试 PyPDF2.PdfFileReader(pdfFileObj,False)