PDF 页面拆分 - PDF 的大小增加
PDF Page Split - Size of PDF increasing
我使用 PyPDF2 创建了一个 PDF 拆分器。它将大小超过 20Mb 的 PDF 拆分为多个较小的 PDF。
我使用的逻辑是将所有页面拆分为单页 PDF,找到每个页面的大小。添加大小直到达到 20 Mb 并拆分。
我面临的问题是 PDF 中的某些页面与原始 PDF 的大小几乎相同。虽然当我手动提取页面时,大小约为 500Kb。
不确定为什么尺寸会增加。请帮我解决这些问题。
for i in range(pdf_reader.numPages):
# New PDF with each page
outputpdf = newpath + '\' + pp.split('.pdf')[0] + 'page' + str(i+1) +'.pdf'
#PDF Writer
output = PyPDF2.PdfFileWriter()
#Writing each page to PDF Writer
output.addPage(pdf_reader.getPage(i))
#Write into the new PDF
with open(outputpdf, "wb") as outputStream:
output.write(outputStream)
经过多次尝试和错误,我找到了答案。我使用 pdfrw 库而不是 PyPDF2 来提取每个页面,我不再面临同样的问题。
我使用 PyPDF2 创建了一个 PDF 拆分器。它将大小超过 20Mb 的 PDF 拆分为多个较小的 PDF。
我使用的逻辑是将所有页面拆分为单页 PDF,找到每个页面的大小。添加大小直到达到 20 Mb 并拆分。
我面临的问题是 PDF 中的某些页面与原始 PDF 的大小几乎相同。虽然当我手动提取页面时,大小约为 500Kb。
不确定为什么尺寸会增加。请帮我解决这些问题。
for i in range(pdf_reader.numPages):
# New PDF with each page
outputpdf = newpath + '\' + pp.split('.pdf')[0] + 'page' + str(i+1) +'.pdf'
#PDF Writer
output = PyPDF2.PdfFileWriter()
#Writing each page to PDF Writer
output.addPage(pdf_reader.getPage(i))
#Write into the new PDF
with open(outputpdf, "wb") as outputStream:
output.write(outputStream)
经过多次尝试和错误,我找到了答案。我使用 pdfrw 库而不是 PyPDF2 来提取每个页面,我不再面临同样的问题。