java opennlp 工具包中的内置 Porter Stemmer
Built-in Porter Stemmer in java opennlp toolkit
好像在python nltk ( ) 中有像porter Stemmer 这样的内置Stemmers,我想知道在java apache opennlp 中是否有任何内置的Porter Stemmer虽然这个包下有一个接口[opennlp.tools.stemmer.Stemmer]。由于我现在不知道或不需要知道词干提取背后的算法,我需要 apache opennlp 工具包下的标准包。如果不存在,java 中的替代方案是什么?
您可以使用 Apache Lucene Snowball 库 here
只需将此 jar 文件放入您的构建路径并使用它
PorterStemmer stemmer = new PorterStemmer();
stemmer.setCurrent(input); //set string you need to stem
stemmer.stem(); //stem the word
stemmer.getCurrent();//get the stemmed word
好像在python nltk ( ) 中有像porter Stemmer 这样的内置Stemmers,我想知道在java apache opennlp 中是否有任何内置的Porter Stemmer虽然这个包下有一个接口[opennlp.tools.stemmer.Stemmer]。由于我现在不知道或不需要知道词干提取背后的算法,我需要 apache opennlp 工具包下的标准包。如果不存在,java 中的替代方案是什么?
您可以使用 Apache Lucene Snowball 库 here
只需将此 jar 文件放入您的构建路径并使用它
PorterStemmer stemmer = new PorterStemmer();
stemmer.setCurrent(input); //set string you need to stem
stemmer.stem(); //stem the word
stemmer.getCurrent();//get the stemmed word