将 wordnet 与 solr7.5.0 集成

integrate wordnet with solr7.5.0

我是solr7.5.0的初学者,对它的每一个模块都不是很了解。在构建问答系统时,我想集成 wordnet,以便获得更好的查询响应。我用谷歌搜索并找到了一些方法和以前的 question 但我真的很困惑如何在 solr 版本 7.5.0 中一步一步地做。

编辑:solr7.5.0 具有 WordnetSynonymParser class,因此,如果有人从事过相同的工作,请指导我如何使用它 class 或者还有其他方法吗?我可以使用 python 来完成吗? 提前致谢。

这个article is very useful for this question, and the integration of wordnet can be done by, there are WordNet prolog file('wn_s.pl') which has synsets, we can convert it to synonyms.txt which can be consumable by Solr. So, to convert wn_s.pl file we can use Syns2Syms.java。它生成 Synonyms.txt 我们可以索引到 solr。

但是,如果是特定领域的搜索,WordNet 扩展只会在相关性方面产生边际收益,因此只需根据索引中的常见标记创建自己的同义词列表即可提供更多相关性。