PDFBox NPE 加载字体

PDFBox NPE loading fonts

我正在使用 PDFBox 从几个 PDF 文档中提取文本,而 运行 我的单元测试套件(通过 gradle)我遇到了由 NullPointerException 引起的间歇性故障 - 我现在的基本假设因为它是由多个线程试图同时将字体加载到字体字典缓存中引起的。

我知道,as is stated in the FAQs, that PDFBox is not threadsafe - but the impression I have got from that and this discussion here,这与同时访问文档的多个线程特别相关,评论似乎暗示字体框缓存应该是线程安全的。

我在单元测试中遇到的异常是:

WARNING: Using fallback font 'LiberationSans-Bold' for 'Arial-BoldItalicMT'
  java.lang.NullPointerException:
  at org.apache.pdfbox.pdmodel.font.FontMapperImpl.getFont(FontMapperImpl.java:463)
  at org.apache.pdfbox.pdmodel.font.FontMapperImpl.findFont(FontMapperImpl.java:417)
  at org.apache.pdfbox.pdmodel.font.FontMapperImpl.getTrueTypeFont(FontMapperImpl.java:321)
  at org.apache.pdfbox.pdmodel.font.PDTrueTypeFont.<init>(PDTrueTypeFont.java:198)
  at org.apache.pdfbox.pdmodel.font.PDFontFactory.createFont(PDFontFactory.java:75)
  at org.apache.pdfbox.pdmodel.PDResources.getFont(PDResources.java:123)
  at org.apache.pdfbox.contentstream.operator.text.SetFontAndSize.process(SetFontAndSize.java:60)
  at org.apache.pdfbox.contentstream.PDFStreamEngine.processOperator(PDFStreamEngine.java:815)
  at org.apache.pdfbox.contentstream.PDFStreamEngine.processStreamOperators(PDFStreamEngine.java:472)
  at org.apache.pdfbox.contentstream.PDFStreamEngine.processStream(PDFStreamEngine.java:446)
  ...
Oct 03, 2016 12:21:24 PM org.apache.pdfbox.pdmodel.font.PDTrueTypeFont <init>
WARNING: Using fallback font 'LiberationSans-Bold' for 'Arial-BoldMT'
Oct 03, 2016 12:21:24 PM org.apache.pdfbox.pdmodel.font.PDTrueTypeFont <init>

我正在使用 PDFBox 版本 2.0.2

有人遇到过这个吗?

这已在 2.0.4 版的 PDFBox 库中修复

原始票证中的详细信息:https://issues.apache.org/jira/browse/PDFBOX-3521