Solr - 从索引数据中取回片段
Solr - Bringing back snippets from indexed data
我有一个 Solr/Lucene 设置,我在其中索引了一组文档(MS Word 文件)并且可以愉快地搜索这些文档的内容。但是,我想 return 文档内容中的一个片段,它显示了匹配行(来自匹配项的 +/- 5 个词)的位置。我尝试跟踪一系列 Google 的点击,但我的索引似乎无法直接访问 "content".
谁能给我一些基本和简单的指示,指出我可能在这方面犯了什么错误 - 到目前为止,我的所有工作都基于 Solr 参考指南的指导和示例 - 所以我不确定是否问题出在搜索参数或原始索引中。
我这样做是为了创建一组清晰的用户需求来构建最终解决方案,而不是自己创建最终解决方案,所以我不是工具方面的专家,也不需要成为专家,只需要证明这个工具集有什么可能。
正如 MatsLindh 上面提到的,问题是配置没有将 Tika 解析的实际内容绘制到特定字段中,因此没有要显示和突出显示的文本的完整内容
为了解决这个问题,我按照 link (https://lucene.apache.org/solr/guide/7_1/uploading-data-with-solr-cell-using-apache-tika.html#configuring-the-solr-extractingrequesthandler) 的指导文件查看了 fmap 上的部分,并使用为上次修改日期给出的示例作为应用指南。
然后我转到相关核心文件夹中的 solrconfig.xml 文件,并在已存在的 fmap 条目下方的代码中添加以下行:
<str name="fmap.content">testcontent</str>
我之前在我的核心中的solr web界面下设置了testcontent字段。然后,我通过命令提示符重新 运行 我的索引行,这似乎在提取基本内容并以基本重点强调它方面起到了作用。
非常感谢您对此的投入 - 我还想测试更多以帮助开发一个清晰的需求集,但这确实有助于证明一些基础知识没有完成。
我有一个 Solr/Lucene 设置,我在其中索引了一组文档(MS Word 文件)并且可以愉快地搜索这些文档的内容。但是,我想 return 文档内容中的一个片段,它显示了匹配行(来自匹配项的 +/- 5 个词)的位置。我尝试跟踪一系列 Google 的点击,但我的索引似乎无法直接访问 "content".
谁能给我一些基本和简单的指示,指出我可能在这方面犯了什么错误 - 到目前为止,我的所有工作都基于 Solr 参考指南的指导和示例 - 所以我不确定是否问题出在搜索参数或原始索引中。
我这样做是为了创建一组清晰的用户需求来构建最终解决方案,而不是自己创建最终解决方案,所以我不是工具方面的专家,也不需要成为专家,只需要证明这个工具集有什么可能。
正如 MatsLindh 上面提到的,问题是配置没有将 Tika 解析的实际内容绘制到特定字段中,因此没有要显示和突出显示的文本的完整内容
为了解决这个问题,我按照 link (https://lucene.apache.org/solr/guide/7_1/uploading-data-with-solr-cell-using-apache-tika.html#configuring-the-solr-extractingrequesthandler) 的指导文件查看了 fmap 上的部分,并使用为上次修改日期给出的示例作为应用指南。
然后我转到相关核心文件夹中的 solrconfig.xml 文件,并在已存在的 fmap 条目下方的代码中添加以下行:
<str name="fmap.content">testcontent</str>
我之前在我的核心中的solr web界面下设置了testcontent字段。然后,我通过命令提示符重新 运行 我的索引行,这似乎在提取基本内容并以基本重点强调它方面起到了作用。
非常感谢您对此的投入 - 我还想测试更多以帮助开发一个清晰的需求集,但这确实有助于证明一些基础知识没有完成。