使用lucene elasticsearch进行校正
correction with lucene elasticsearch
我是 Lucene Elasticsearch
的新手。我不知道该如何处理。在文档中,我没有找到我要找的东西。
我确实有一篇文章,其中包含一些拼写错误的单词,我想通过包含正确单词的大型数据库进行更正。
因为我有一个很大的数据库,所以我想到了Lucene Slasticsearch
以便快速研究数据库。
问题
我知道我们使用 Lucene Slasticsearch
进行搜索和索引,但我不知道我们是否可以用错误的词进行研究,并且 returns 正确的词是 "similar"错了。
谢谢。
如果您能提及如何定义一个相似的词,例如仅基于拼写或语音,这将很有帮助。
假设您只想进行基于拼写的更正,最好的方法是使用自定义分析器,而 Elasticsearch 有一大堆选项可供选择。
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-analyzers.html
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-custom-analyzer.html
您需要做的是:
- 首先决定要使用哪种类型的过滤器和分词器。
- 然后在您的索引设置中添加分析器。
- 然后在您的映射中添加分析器。
我是 Lucene Elasticsearch
的新手。我不知道该如何处理。在文档中,我没有找到我要找的东西。
我确实有一篇文章,其中包含一些拼写错误的单词,我想通过包含正确单词的大型数据库进行更正。
因为我有一个很大的数据库,所以我想到了
Lucene Slasticsearch
以便快速研究数据库。
问题
我知道我们使用 Lucene Slasticsearch
进行搜索和索引,但我不知道我们是否可以用错误的词进行研究,并且 returns 正确的词是 "similar"错了。
谢谢。
如果您能提及如何定义一个相似的词,例如仅基于拼写或语音,这将很有帮助。
假设您只想进行基于拼写的更正,最好的方法是使用自定义分析器,而 Elasticsearch 有一大堆选项可供选择。 https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-analyzers.html https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-custom-analyzer.html
您需要做的是:
- 首先决定要使用哪种类型的过滤器和分词器。
- 然后在您的索引设置中添加分析器。
- 然后在您的映射中添加分析器。