Apache Tika 和 Apache PDFBox 2.0

Apache Tika and Apache PDFBox 2.0

我们使用的是 tika 1.4。现在我们需要使用PDF Box 2.0.1 进行数字签名。我可以看到tika中使用了PDF框的一些类。 Pdf box 是 tika 的一部分吗?如果是这样,我不需要单独添加 pdf 框。我呢? tika 1.13 是否向后兼容 tika 1.4?

第一个捆绑 Apache PDFBox 2.0 的 Apache Tika 版本是 Apache Tika 1.13,如 Apache Tika latest news on the project homepage

中所示

A​​pache Tika 的版本通常是向后兼容的,任何问题都会在 release changes file

中注明

无法将 PDFBox 2.0 与 Tika 1.4 等旧版本一起使用。如果您想使用最新的 PDFBox,您必须升级到匹配的较新的 Tika 版本

因此,您应该将 Apache Tika 版本升级到更新版本,例如 1.13,升级所有 Tika 依赖项