ReportLab 添加多页 PDF 到 Canvas

ReportLab Add Multi-page PDF to Canvas

将 PdfReader 与 ReportLab 一起使用,我尝试拉入 PDF 页面,保存(均成功),然后拉入多页 PDF 并执行相同操作。 我知道如何一次拉入 PDF 一页,但我很难拉入超过一页。

from reportlab.pdfgen import canvas
from pdfrw import PdfReader
from pdfrw.buildxobj import pagexobj
from pdfrw.toreportlab import makerl

c = canvas.Canvas(Out_Folder+pdf_file_name)
c.setPageSize([11*inch, 8.5*inch])

page = PdfReader(folder+'2_VisionMissionValues.pdf',decompress=False).pages
p = pagexobj(page[0])
c.setPageSize([11*inch, 8.5*inch]) #Set page size (for landscape)
c.doForm(makerl(c, p))
c.showPage()

p3_ = PdfReader(m4folder+'Academy.pdf',decompress=False).pages

这是我迷路的地方。我知道这只适用于拉入第一页....

p3 = pagexobj(p3_[0])

但是如果我想拉入 PDF 的所有页面,我不确定该怎么做。 我试过这个:

p3 = [pagexobj(x) for x in p3_[:]]

但它导致了断言错误(见下文)。

c.setPageSize([8.5*inch, 11*inch]) #Set page size (for portrait)
c.doForm(makerl(c, p3))
c.showPage()
c.save()


AssertionError: [{'/BBox': [0.0, 0.0, 792.0, 612.0], '/Filter': '/FlateDecode', '/FormType': 1, '/Matrix': [0, 1, -1, 0, 0, 0], '/Length': '56', '/Subtype': '/Form', '/Resources': {'/ProcSet': ['/PDF', '/ImageB', '/ImageC', '/ImageI'], '/XObject': {'/Im1': (8, 0)}}, '/Type': '/XObject'}, {'/BBox': [0.0, 0.0, 792.0, 612.0], '/Filter': '/FlateDecode', '/FormType': 1, '/Matrix': [0, 1, -1, 0, 0, 0], '/Length': '56', '/Subtype': '/Form', '/Resources': {'/ProcSet': ['/PDF', '/ImageB', '/ImageC', '/ImageI'], '/XObject': {'/Im2': (17, 0)}}, '/Type': '/XObject'}]

reportlab canvas 一次只能在一页上工作,因此您需要在每个输出页面上使用一次 reportlab doForm()showPage() 函数,而不是在所有页面上作为列表。

编辑添加

我只记得我有一些示例代码可以使用 reportlab here 将 PDF 文件页面的子集复制到输出文件。内部循环执行此操作:

for page in pages:
    canvas.setPageSize((page.BBox[2], page.BBox[3]))
    canvas.doForm(makerl(canvas, page))
    canvas.showPage()

就其价值而言,如果您只是复制页面,则不需要 reportlab;上面的目录中有一个类似的子集示例,它仅使用 pdfrw。

(免责声明:我是 pdfrw 的主要作者。)

我希望这个答案有助于使用 Canvas 在同一个 pdf 文件上生成多个页面。 基于 Reportlab userguide :

The showPage method causes the canvas to stop drawing on the current page and any further operationswill draw on a subsequent page (if there are any further operations -- if not no new page is created). Thesave method must be called after the construction of the document is complete -- it generates the PDFdocument, which is the whole purpose of the canvas object.

这是一个简单的例子。

from reportlab.pdfgen.canvas import Canvas

def write(myfile, page_number):
    myfile.drawString(200, 600, 'Page number %i script' % page_number)

myfile = Canvas('multi_pages.pdf')
total_pages = 3

for i in range(total_pages):
    write(myfile, i)
    myfile.showPage()

myfile.save()