如何嵌入其他 PDF iText 7 中的所有字体

How to embed all fonts from other PDF iText 7

我正在尝试使用 iText7/C# 叠加两个 PDF 文件。 第一个是背景,第二个是包含表单字段。 一切正常,唯一的问题是我丢失了第二个文件中的字体。

我尝试如下:

static public bool Overlay(string back_path, string front_path, string merge_path)
{
    PdfReader reader;
    PdfDocument pdf = null, front;
    try
    {
        reader = new PdfReader(back_path);
        pdf = new PdfDocument(reader, new PdfWriter(merge_path));
        front = new PdfDocument(new PdfReader(front_path));

        var form = PdfAcroForm.GetAcroForm(front, false);
        PdfAcroForm dform = PdfAcroForm.GetAcroForm(pdf, true);
        IDictionary<String, PdfFormField> fields = form.GetFormFields();

        // copy styles
        dform.SetDefaultResources(form.GetDefaultResources());
        dform.SetDefaultAppearance(form.GetDefaultAppearance().GetValue());

        // do overlay
        foreach (KeyValuePair<string, PdfFormField> pair in fields)
        {
            try
            {
                var field = pair.Value;
                PdfPage page = field.GetWidgets().First().GetPage();

                int pg_no = front.GetPageNumber(page);
                if (pg_no < front_start_page || pg_no > front_end_page)
                    continue;
                PdfObject copied = field.GetPdfObject().CopyTo(pdf, true);
                PdfFormField copiedField = PdfFormField.MakeFormField(copied, pdf);

                // The following returns null. If it returns something, I think I could use copiedField.setFont(font). 
                // var font = field.GetFont(); 

                dform.AddField(copiedField, pdf.GetPage(pg_no));
            }
            catch (Exception ex)
            {
                System.Diagnostics.Debug.WriteLine($"Overlaying field {pair.Key} failed. ({ex.Message})");
            }
        }

        pdf.Close();
        return true;
    }
    catch (Exception ex)
    {
        throw new OverlayException(ex.Message);
    }
}

public static PdfDictionary get_font_dict(PdfDocument pdfDoc)
{
    PdfDictionary acroForm = pdfDoc.GetCatalog().GetPdfObject().GetAsDictionary(PdfName.AcroForm);
    if (acroForm == null)
    {
        return null;
    }
    PdfDictionary dr = acroForm.GetAsDictionary(PdfName.DR);
    if (dr == null)
    {
        return null;
    }
    PdfDictionary font = dr.GetAsDictionary(PdfName.Font);
    return font;
}

所以基本上我从第二个 PDF 中获取所有字体并将它们复制到最终 PDF 中。 但是没用。

从逻辑上讲,我认为将原始字段的字体设置为复制的字体是正确的方法。 我的意思是 PdfFormField.GetFont() 和 SetFont()。 但它总是 returns null.

在您澄清的评论中:

the background PDF can be assumed not to have form fields or annotations. I mean we can assume background PDF only contains static content (scanned form) and the front PDF only contains formfields.

在这种情况下,实现您的方法的最简单方法是将背景作为 xobject 添加到表单 PDF,而不是将表单添加到背景 PDF。

您可以简单地这样做:

PdfReader formReader = new PdfReader(front_path);
PdfReader backReader = new PdfReader(back_path);
PdfWriter writer = new PdfWriter(merge_path);

using (PdfDocument source = new PdfDocument(backReader))
using (PdfDocument target = new PdfDocument(formReader, writer))
{
    PdfFormXObject xobject = source.GetPage(1).CopyAsFormXObject(target);
    PdfPage targetFirstPage = target.GetFirstPage();
    PdfStream stream = targetFirstPage.NewContentStreamBefore();
    PdfCanvas pdfCanvas = new PdfCanvas(stream, targetFirstPage.GetResources(), target);
    Rectangle cropBox = targetFirstPage.GetCropBox();
    pdfCanvas.AddXObject(xobject, cropBox.GetX(), cropBox.GetY());
}

根据背景和表单 PDF 的确切静态内容,您可能希望使用 NewContentStreamAfter 而不是 NewContentStreamBefore,甚至使用一些漂亮的混合模式来获取确切的静态内容看你想要的。