GemBox DocumentModel.Load() 无法读取 Pdf 文件

GemBox DocumentModel.Load() cannot read Pdf file

目前我无法使用 GemBox 加载原始 pdf 文档。它在 image 中给出了以下错误。我正在使用 Acrobat 9。

我也尝试过使用 8/16/2018 修复程序。任何建议将不胜感激。

我使用的基本代码是,

using GemBox.Document;
using System;

namespace Pdf2Text
{
   class Program
   {

      [STAThread]
      static void Main(string[] args)
      {
          ComponentInfo.SetLicense("My-License");

          DocumentModel document = null;
          document = DocumentModel.Load(@"E:\data\testing\HA021.pdf");
          document.Save(@"E:\data\testing\HA021.docx");
      }
    }
}

GemBox.Document 中 PDF reader 的当前实现仍处于测试阶段,无法处理此 PDF 功能,"iref streams" 是存储在流中的交叉引用表。

但是,GemBox.Pdf 可以处理交叉引用流,因此作为解决方法,您可以执行以下操作:

// Load PDF with GemBox.Pdf.
var pdfDocument = PdfDocument.Load("Sample.pdf");
pdfDocument.SaveOptions.CrossReferenceType = PdfCrossReferenceType.Table;

// Save PDF with GemBox.Pdf.
var pdfStream = new MemoryStream();
pdfDocument.Save(pdfStream);

// Load PDF with GemBox.Document.
var document = DocumentModel.Load(pdfStream, LoadOptions.PdfDefault);

最后关于 PDF 到 DOCX 的转换,GemBox.Document 的 PDF reader 当前用于从 PDF 文件中提取文本和表格,它不用于任何高保真度要求。