Solr 中的词干参数

Stemming parameter in Solr

是否有任何参数(edismax 或 dismax 或任何其他)我可以设置以便词干提取在 Solr 中工作,或者我需要在 Solr 的 schema.xml 中进行更改以实现词干提取? 问题是如果我默认更改 schema.xml stemming/phoentic 我不想要的工作?我正在使用来自第三方应用程序的 Solr,在 UI 中我们有用于提取 check/uncheck 的复选框,我将这些参数传递给 Solr 并从 Solr 获取数据,我无法传递此 UI 参数到 SOlr,所以如果 Solr 端有任何参数,我可以将其传递给词干提取工作?

请告诉我?

词干提取作为分析链的一部分执行,因此是该特定字段的架构定义方式的一部分。

当您考虑词干提取的工作原理时,这样做的原因就很明显了 - 为了使词干提取有意义,必须对词条进行词干提取当它被编入索引时,以及当它被编入索引时查询。

Lucene 获取您的输入字符串,通过您的分析链运行它,并将生成的标记保存到它的索引中。给它 what are you asking 可能会在通过空格标记化并应用词干提取后最终成为 whatareyouask

查询时会发生相同的操作,因此如果有人搜索 asks,则令牌会被提取到 ask - 然后与索引中的内容进行比较。如果在索引时没有发生词干提取,那么索引中会出现 asking,查询时会出现 ask - 这不匹配,因为标记不一样.

在您的第三方应用程序中,词干提取选项可能会在将内容发送到 Solr 之前在应用程序内部执行词干提取。

你也可以use the Schema API to dynamically update and change field type definitions.