Apache Solr:条件块
Apache Solr: Conditional block
我正在从 HBase 读取列并使用吗啡文件在 Solr 中对其进行索引。一些字段值将使用英语或德语。有没有一种方法可以将字段类型指定为 "text_english_german" 并且在 "text_english_german" 的定义中我们可以进行条件检查以查看它是英语还是德语并使用特定于语言的 Stemmer 过滤器工厂索引和查询数据?
谢谢,
基肖尔
使用稍微不同的方法,您可以定义两个字段:
- text_en
- text_de
他们每个人都会配置特定语言的文本分析。然后,您可以使用语言自动检测 UpdateRequestProcessor [1]。有很多参数可以调整此类组件的行为。
[1] https://wiki.apache.org/solr/LanguageDetection
[2] https://cwiki.apache.org/confluence/display/solr/Detecting+Languages+During+Indexing
我正在从 HBase 读取列并使用吗啡文件在 Solr 中对其进行索引。一些字段值将使用英语或德语。有没有一种方法可以将字段类型指定为 "text_english_german" 并且在 "text_english_german" 的定义中我们可以进行条件检查以查看它是英语还是德语并使用特定于语言的 Stemmer 过滤器工厂索引和查询数据?
谢谢, 基肖尔
使用稍微不同的方法,您可以定义两个字段:
- text_en
- text_de
他们每个人都会配置特定语言的文本分析。然后,您可以使用语言自动检测 UpdateRequestProcessor [1]。有很多参数可以调整此类组件的行为。
[1] https://wiki.apache.org/solr/LanguageDetection
[2] https://cwiki.apache.org/confluence/display/solr/Detecting+Languages+During+Indexing