是否有处理莎士比亚英语的 Lucene 词干提取器?

Are there any Lucene stemmers that handle Shakespearean English?

我正在尝试索引一些旧文档以供搜索 -- 16、17、18 世纪。

现代词干分析器似乎无法处理过时的词尾:worketh、liveth、walketh。

是否有专门研究莎士比亚和钦定版圣经时代英语的词干提取器?我目前正在使用 solr.PorterStemFilterFactory.

看起来像rule changes are minimal

因此,copy/modify PorterStemmer class 和相关的 Factories/Filters 是可能的。

或者可以在 Porter 之前将这些特定规则添加为正则表达式过滤器。