渲染 pdf.js 页面像真正的 html 元素而不是 canvas 或 svg?

render pdf.js page like real html elements not canvas or svg?

我正在尝试制作可以阅读 pdf 的简单移动设备 UI,但我计划通过使用我自己制作的 pdf 阅读器来添加许多功能,而不仅仅是使用 [=15 制作的查看器=] 团队,所以我问是否有任何方法可以将 pdf 渲染为带有元素的 HTML,就像他们在查看器上所做的那样,我对 canvas 感到不舒服,任何帮助,谢谢提前

我认为没有这样的选择。

使用本机支持在浏览器(不是每个浏览器,也不是移动浏览器)中显示 pdf 文件的唯一方法是将 url 传递给 iframe/embed 标记 <iframe src="url_to_your.pdf">

但请注意,这仍然不会产生您正在寻找的 HTML 输出。

好的伙计们,我终于找到了路 pdf.js 有一个名为 getTextContent() 的方法,当您呈现页面时会在每个页面上调用这些方法

只需获取文档的每一页

PDFJS.getDocument(url)
  .then(function(pdf) {

    // Get div#container and cache it for later use
    var container = document.getElementById("container");

    // Loop from 1 to total_number_of_pages in PDF document
    for (var i = 1; i <= pdf.numPages; i++) {

        // Get desired page
        pdf.getPage(i).then(function(page) {

          var scale = 1.5;
          var viewport = page.getViewport(scale);
          var div = document.createElement("div");

          // Set id attribute with page-#{pdf_page_number} format
          div.setAttribute("id", "page-" + (page.pageIndex + 1));

          // This will keep positions of child elements as per our needs
          div.setAttribute("style", "position: relative");

          // Append div within div#container
          container.appendChild(div);

          // Create a new Canvas element
          var canvas = document.createElement("canvas");

          // Append Canvas within div#page-#{pdf_page_number}
          div.appendChild(canvas);

          var context = canvas.getContext('2d');
          canvas.height = viewport.height;
          canvas.width = viewport.width;

          var renderContext = {
            canvasContext: context,
            viewport: viewport
          };

          // Render PDF page
          page.render(renderContext);
        });
    }
});

获取每一页的文本内容 请记住,它是以前的连续代码 然后在page.render()里面添加修改成这样

// Render PDF page
page.render(renderContext)
  .then(function() {
    // Get text-fragments
    return page.getTextContent();
  })
  .then(function(textContent) {
    // Create div which will hold text-fragments
    var textLayerDiv = document.createElement("div");

    // Set it's class to textLayer which have required CSS styles
    textLayerDiv.setAttribute("class", "textLayer");

    // Append newly created div in `div#page-#{pdf_page_number}`
    div.appendChild(textLayerDiv);

    // Create new instance of TextLayerBuilder class
    var textLayer = new TextLayerBuilder({
      textLayerDiv: textLayerDiv, 
      pageIndex: page.pageIndex,
      viewport: viewport
    });

    // Set text-fragments
    textLayer.setTextContent(textContent);

    // Render text-fragments
    textLayer.render();
  });

有关如何操作的完整教程,请转到 here