"WARNING: JBIG2ImageReader not loaded." 但 [org.apache.pdfbox/jbig2-imageio "3.0.1"] 存在吗?

"WARNING: JBIG2ImageReader not loaded." but [org.apache.pdfbox/jbig2-imageio "3.0.1"] exists?

我的项目是使用 pantomime 2.10.0 库 [com.novemberain/pantomime "2.10.0"] 使用 Leiningen 构建的,它是 Apache Tika 的一些 Clojure 包装器。我在 https://pdfbox.apache.org/2.0/dependencies.html 浏览了一些文档,试图消除 org.apache.tika.config.InitializableProblemHandler 发出的警告,但似乎仍然存在。

Sep 06, 2018 1:59:25 PM org.apache.tika.config.InitializableProblemHandler handleInitializableProblem
WARNING: JBIG2ImageReader not loaded. jbig2 files will be ignored
See https://pdfbox.apache.org/2.0/dependencies.html#jai-image-io
for optional dependencies.

我很难理解我还必须向我的 project.clj 依赖项添加什么才能使此警告消失。为什么 [org.apache.pdfbox/jbig2-imageio "3.0.1"] 不满足依赖关系。

我的 project.clj 的相关部分:依赖项是:

[org.xerial/sqlite-jdbc "3.23.1"]
[org.apache.pdfbox/jbig2-imageio "3.0.1"]
[com.github.jai-imageio/jai-imageio-core "1.4.0"]
[com.github.jai-imageio/jai-imageio-jpeg2000 "1.3.0"]
[com.novemberain/pantomime "2.10.0"]

我错过了什么?

要禁用这些警告,您需要在 Tika 配置文件中禁止它们。

tika.xml:

<?xml version="1.0" encoding="UTF-8"?>
<properties>
    <service-loader initializableProblemHandler="ignore"/>
</properties>

然后在您的代码中使用此配置文件:

(let [handler  (BodyContentHandler.)
          config   (TikaConfig. (FileInputStream. "tika.xml"))
          parser   (AutoDetectParser. config)
          metadata (Metadata.)
          stream   (FileInputStream. "resources/memory.pdf")]       
     (.parse parser stream handler metadata)    
     (prn (str handler)))

要启用对 JBIG 的支持以及您应该参考的所有内容 tika-parsers-1.17.jar!/META-INF/maven/org.apache.tika/tika-parsers/pom.xml,其中包含对受支持插件及其版本的所有引用。将这些插件添加到您的依赖项中。

对于 [com.novemberain/pantomime "2.10.0"] 你应该选择

[com.levigo.jbig2/levigo-jbig2-imageio "1.6.5"]
[com.github.jai-imageio/jai-imageio-core "1.3.1"]
[com.github.jai-imageio/jai-imageio-jpeg2000 "1.3.0"]

它适用于 Java 1.8,但我相信它不适用于 Java 1.10,它现在有这个新模块。这些插件之一不支持此功能。