索引 PDF - 使用 Apache Solr 和 Apache Tika 进行分面搜索

Indexing PDF - Faceted Search with Apache Solr and Apache Tika

两周前,我无法在 Internet 上找到解决方案。我需要将 Web 应用程序与 Apache Solr 和 Apache tika 集成,以便对系统数据库中的 PDF 进行分面搜索。 solr 和 tika 在我的服务器上的配置一切正常,但由于我是这两个工具的新手,我不确定如何相互集成以及如何与应用程序集成。

Solr 6.2 在 example/files 中附带 files 示例,该示例专门配置为索引和浏览内容丰富的文件(如 PDF)。

首先使用它并尝试了解它是如何组合在一起的。