从哪里获得 Apache Tika jar?

where to get Apache Tika jar?

全部:

我尝试使用 Apache Tika 构建应用程序来解析 PDF,但我想知道我在哪里可以获得像 tika-core/target/tika-core-.jar 和 tika-parsers/target/tika-parsers-[=20 这样的库=].jar

我只找到tika-app,没有上面这样的jar。

http://tika.apache.org/1.11/gettingstarted.html

Apache Tika 有大量它需要的依赖项 运行。没有他们在场,它的作用很小!

因此,您需要使用依赖项管理工具来获取 Apache Tika,以及它需要的其他库。如果您使用 Apache Maven 来执行此操作,则可以 follow the instructions on the Tika website to add it as a dependency to your project 在您的 pom 中添加一个部分,例如:

<dependency>
   <groupId>org.apache.tika</groupId>
   <artifactId>tika-parsers</artifactId>
   <version>1.11</version>
</dependency>

Apache Tika quickstart page 还列出了关于向 Tika 添加依赖项的说明,以及所有必需的依赖项,对于 Gradle 和 Ivy 构建也是如此。您真的应该使用 Maven、Gradle 或 Ivy 之一来为您处理依赖关系

如果你真的想自己处理所有依赖项,你可以在 Maven 中央找到 Tika Core 和 Tika Parsers 二进制 jar,在通常的地方。对于 Tika 1.11,这是 here for the tika-core jar and here for the tika-parsers jar。但是,如前所述,您几乎肯定不想手动执行此操作!