Python PDF 表单扁平化

Python PDF form flattening

如何"flatten" PDF 表单?我有一个 PDF 表格需要填写。我有一个简单的例子,其中 TEMP_FORM.pdf 是 from, data_dict 是要填充的值 TEMP_FORM.pdf。输出文件保存为 FORM1.pdf 但仍可编辑我需要展平该文件以便无法编辑该值。

from PyPDF2 import PdfFileReader, PdfFileWriter

TEMPLATE_PATH = 'TEMP_FORM.pdf'
OUTPUT_PATH = 'FORM1.pdf'
data_dict = {
    'name': 'XYZ',
    'address': 'PQR',
    'email': 'xyz@gmail.com',
    'send_date': '2018-02-13',
    'due_date': '2018-03-13'
}

if __name__ == '__main__':
    input_file = PdfFileReader(open(TEMPLATE_PATH, "rb"))

    output_file = PdfFileWriter()
    output_file.addPage(input_file.getPage(0))
    output_file.updatePageFormFieldValues(output_file.getPage(0), data_dict)
    output_stream = open(OUTPUT_PATH, "wb")

    output_file.write(output_stream)
    output_stream.close()

根据 Adob​​e 文档,您可以将可编辑表单字段的位位置更改为 1,使它们只读。我在这里提供了一个完整的解决方案,但它使用了 Django:

Adobe 文档(第 552 页):

https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/pdf_reference_archives/PDFReference.pdf

使用 PyPDF2 填充字段,然后遍历注释并执行此操作:

for j in range(0, len(output_file['/Annots'])):
    writer_annot = output_file['/Annots'][j].getObject()
    for field in data_dict: 
        if writer_annot.get('/T') == field:
            writer_annot.update({
                NameObject("/Ff"): NumberObject(1)   # make ReadOnly
            })