stopwords_path 的停用词分析器未按预期工作
Stop word analyzer with stopwords_path not working as expected
我使用的是 ES2.3,我有一个停用词文件列表,其中混合了大写字母和小写字母
我正在尝试创建一个忽略停用词大小写的分析器
"stopword_analyzer": {
"type": "standard",
"ignore_case": "true"
"stopwords_path": "stopwords_english.txt"
}
我试过在上面使用一个停用词来检查 stopwords_path 参数
是否有问题
"stopword_analyzer6": {
"type": "stop",
"stopwords": "[UPPERCASE]",
"ignore_case": "true"
}
但这也失败了
我也尝试过应用小写过滤器,但效果不佳
"stopword_analyzer5": {
"type": "stop",
"stopwords_path": "stopwords_english.txt",
"filter": [
"lowercase"
]
我最后做的事情成功了,在自定义分析器上使用带有小写过滤器的停用词过滤器
"analysis": {
"filter": {
"my_stop":{
"type": "stop",
"ignore_case": "true",
"stopwords_path": "stopwords_english.txt"
}
},
"analyzer": {
"stopword_analyzer7": {
"type": "custom",
"tokenizer": "whitespace",
"stopwords_path": "stopwords_english.txt",
"filter": [
"lowercase",
"my_stop"
]
}
}
}
我使用的是 ES2.3,我有一个停用词文件列表,其中混合了大写字母和小写字母 我正在尝试创建一个忽略停用词大小写的分析器
"stopword_analyzer": {
"type": "standard",
"ignore_case": "true"
"stopwords_path": "stopwords_english.txt"
}
我试过在上面使用一个停用词来检查 stopwords_path 参数
是否有问题 "stopword_analyzer6": {
"type": "stop",
"stopwords": "[UPPERCASE]",
"ignore_case": "true"
}
但这也失败了
我也尝试过应用小写过滤器,但效果不佳
"stopword_analyzer5": {
"type": "stop",
"stopwords_path": "stopwords_english.txt",
"filter": [
"lowercase"
]
我最后做的事情成功了,在自定义分析器上使用带有小写过滤器的停用词过滤器
"analysis": {
"filter": {
"my_stop":{
"type": "stop",
"ignore_case": "true",
"stopwords_path": "stopwords_english.txt"
}
},
"analyzer": {
"stopword_analyzer7": {
"type": "custom",
"tokenizer": "whitespace",
"stopwords_path": "stopwords_english.txt",
"filter": [
"lowercase",
"my_stop"
]
}
}
}