itextpdf 能否从像 IRS 1065 表格这样的多页复杂 PDF 中提取表格数据? (电脑生成)

Could itextpdf extract tabular data from a multipage, complex PDF like a IRS Form 1065? (Computer generated)

我看到的一些示例只能处理简单的表格,例如 W2 或 W9。 当前版本是否能够像这种形式那样从复杂的表格中提取数据? IRS Tax Form 1065

使用 iText 从表单中提取信息是通过 AcroFields 对象完成的。

PdfReader reader = new PdfReader(source);
AcroFields acroFields = reader.getAcroFields();
String fieldValue = acroFields.getField(fieldName);

您可以通过调用此代码获得一组字段名称:

Set<String> keys = acroFields.getFields().keySet();

然后遍历 acroFields 对象。然后您如何处理数据由您决定。

可以找到使用 AcroFields 的其他示例 here and enter link description here

您的文档似乎还包含 XFA(XML 基于表单技术)。您可以从 AcroFields 对象获取 XfaForm 对象,但从那里您需要自己解析 XML 结构。