HTML 到带有 base64 图像的 PDF 抛出 FileNotFoundException

HTML to PDF with base64 images throws FileNotFoundException

我正在使用 itextpdf-5.0.6.jar (Java 8),当我尝试使用 base64 图像标签导出 html 代码时,出现文件未找到异常。

如果我删除图片标签,一切都会很好!

我发现很少有关于覆盖图像标签处理器的解决方案,但大多数都是旧的并且与 5.0.6 版本不兼容。

这是我发送的HTML:

    "<!doctype html>\n<html lang=\"en\">\n<head>\n    
<meta charset=\"UTF-8\">\n    
<title>Test PDF</title>\n</head>\n<body>\n\n
<div class=\"pdf-header\">\n\n 
  <img src=\"\">     \n\n\n</div>\n\n<div class=\"main\">\n<div class=\"canvas\">\nHellow world</div></div></body>\n</html>"

我的部分代码:

fileOutputStream = new FileOutputStream(file);
Document document = new Document();
PdfWriter.getInstance(document, fileOutputStream);
document.open();
HTMLWorker htmlWorker = new HTMLWorker(document);
StringReader stringReader = new StringReader(htmlCode);
htmlWorker.parse(stringReader);
document.close();
fileOutputStream.close();

我们会提供任何帮助 谢谢

请停止使用 HTMLWorker,正如在 Whosebug 上多次重复的那样,HTMLWorker class 早已被 XML Worker 放弃。我们不会投资于 HTMLWorker 的进一步开发,因此使用它是一个非常糟糕的选择。请切换到 XML 工人。

同时升级到最新的 iText 版本,您使用的版本来自 February 4, 2011,在过去的 4 年中修复了许多错误。确保您的 iText jar 和 XML Worker jar 具有相同的版本号。

尚不支持 Base64 图像,但我已经为您提供了一个非常简单的概念证明,展示了添加对此类图像的支持是多么容易。看看 ParseHtml4 example and the resulting PDF: html_4.pdf.

为此,您需要编写 ImageProvider 接口的实现。我通过扩展 AbstractImageProvider class:

来做到这一点
class Base64ImageProvider extends AbstractImageProvider {

    @Override
    public Image retrieve(String src) {
        int pos = src.indexOf("base64,");
        try {
            if (src.startsWith("data") && pos > 0) {
                byte[] img = Base64.decode(src.substring(pos + 7));
                return Image.getInstance(img);
            }
            else {
                return Image.getInstance(src);
            }
        } catch (BadElementException ex) {
            return null;
        } catch (IOException ex) {
            return null;
        }
    }

    @Override
    public String getImageRootPath() {
        return null;
    }
}

如您所见,我检查通过 img 标记的 src 属性传递给 XML Worker 的任何内容中是否存在 "base64,"。如果 String 存在,我将解码 "base64," 之后的任何内容,然后 return 使用结果字节创建的 Image 对象。

一旦有了这个 ImageProvider 实现,只需将它传递给 XML Worker。