使用 Apache SolR 在 Microsoft 文档上进行全文搜索

Full-text search on microsoft docs using Apache SolR

Apache Solr 是否支持对 Microsoft 文档(例如 word 或 powerpoint)进行全文搜索?如果是这样,我在哪里可以找到教程?

是的。 Solr 使用 Apache Tika 进行内容提取并支持大多数文件类型。

您需要在 solrconfig.xml 中配置处理程序。

这是一个很好的入门文档,其中包含示例: https://lucene.apache.org/solr/guide/6_6/uploading-data-with-solr-cell-using-apache-tika.html