OpenNLP 词形还原示例

OpenNLP lemmatization example

有谁知道我在哪里可以找到如何在 OpenNLP 库中使用 SimpleLemmatizer() class 的示例,以及在哪里可以找到示例英语词典?文档中似乎缺少它。

您可以从这里下载字典 - en-lemmatizer.dict

示例:

import opennlp.tools.lemmatizer.SimpleLemmatizer;

private static SimpleLemmatizer lemmatizer;

private String lemmatize(String word, String postag) throws IOException {
    if (lemmatizer == null) {
        InputStream is = getClass().getResourceAsStream("/models/en-lemmatizer.dict");
        lemmatizer = new SimpleLemmatizer(is);
        is.close();
    }
    String lemma = lemmatizer.lemmatize(word, postag);
    return lemma;
}

示例代码取自此处 - DocumentTaggerService

RAVI 没有完全回答问题:

您在 autodoc 中没有看到 SimpleLemmatizer 的原因是它实际上并不存在。

改为使用 DictionaryLemmatizer。

opennlp.tools.lemmatizer.DictionaryLemmatizer