是否有处理莎士比亚英语的 Lucene 词干提取器?
Are there any Lucene stemmers that handle Shakespearean English?
我正在尝试索引一些旧文档以供搜索 -- 16、17、18 世纪。
现代词干分析器似乎无法处理过时的词尾:worketh、liveth、walketh。
是否有专门研究莎士比亚和钦定版圣经时代英语的词干提取器?我目前正在使用 solr.PorterStemFilterFactory
.
因此,copy/modify PorterStemmer class 和相关的 Factories/Filters 是可能的。
或者可以在 Porter 之前将这些特定规则添加为正则表达式过滤器。
我正在尝试索引一些旧文档以供搜索 -- 16、17、18 世纪。
现代词干分析器似乎无法处理过时的词尾:worketh、liveth、walketh。
是否有专门研究莎士比亚和钦定版圣经时代英语的词干提取器?我目前正在使用 solr.PorterStemFilterFactory
.
因此,copy/modify PorterStemmer class 和相关的 Factories/Filters 是可能的。
或者可以在 Porter 之前将这些特定规则添加为正则表达式过滤器。