从没有 XFA 格式的 PDF 文档中读取数据
Read data from a PDF document that does not have an XFA-form
我使用 iText 阅读包含 XFA 表单的 PDF 文档。
我将它转换为 XML,从 XML 中读取数据并将其插入到数据库中。
但是,如果我在 PDF 中没有 XFA 表单,那么如何有效地从 PDF 中读取数据?
这取决于您的期望。
您可以使用文本提取来检索特定页面上的所有文本。然后如何处理文本取决于您。 (例如正则表达式)
您还可以选择使用 pdf2Data,这是一个 iText7 附加组件,可让您将文档与模板进行匹配。 pdf2Data 似乎很合适,因为它会生成 XML 个文件作为输出。
可以在此处找到有关 pdf2Data 的更多信息http://itextpdf.com/itext7/pdf2Data
我使用 iText 阅读包含 XFA 表单的 PDF 文档。 我将它转换为 XML,从 XML 中读取数据并将其插入到数据库中。 但是,如果我在 PDF 中没有 XFA 表单,那么如何有效地从 PDF 中读取数据?
这取决于您的期望。
您可以使用文本提取来检索特定页面上的所有文本。然后如何处理文本取决于您。 (例如正则表达式)
您还可以选择使用 pdf2Data,这是一个 iText7 附加组件,可让您将文档与模板进行匹配。 pdf2Data 似乎很合适,因为它会生成 XML 个文件作为输出。
可以在此处找到有关 pdf2Data 的更多信息http://itextpdf.com/itext7/pdf2Data