为什么 SOLR KStemFilterFactory 不将 "cards" 词干化为 "card"?
Why doesn't SOLR KStemFilterFactory stem the word "cards" to "card"?
我在 SOLR 中使用 KStem Filter Factory(KStemFF)。我意识到 KStemFF 并非 100% 准确。
例如,它不会将 "cards" 词干化为 "card"。
"sound cards" 和 "sound card" return 不同的结果。
有没有办法只使用 KStemFF 来实现这个功能?我意识到在这种情况下使用其他词干提取器(如 porter-stemmer)可能会有所帮助,但我真的不想在项目中使用多个词干提取器。
KStem 在词干提取方面不如 PorterStem 激进,因此可能会根据它的规则跳过某些复数的转换。
在做出选择之前,您可能希望根据性能和结果比较几个词干分析器。没有任何一个词干分析器可以为您提供 100% 的准确性和所需的结果,它必须是根据您的结果最适合的。
我在 SOLR 中使用 KStem Filter Factory(KStemFF)。我意识到 KStemFF 并非 100% 准确。
例如,它不会将 "cards" 词干化为 "card"。
"sound cards" 和 "sound card" return 不同的结果。
有没有办法只使用 KStemFF 来实现这个功能?我意识到在这种情况下使用其他词干提取器(如 porter-stemmer)可能会有所帮助,但我真的不想在项目中使用多个词干提取器。
KStem 在词干提取方面不如 PorterStem 激进,因此可能会根据它的规则跳过某些复数的转换。 在做出选择之前,您可能希望根据性能和结果比较几个词干分析器。没有任何一个词干分析器可以为您提供 100% 的准确性和所需的结果,它必须是根据您的结果最适合的。