印尼投票使用 Lucene
Indonesian Stemmer Using Lucene
这是 Lucene library 中的 class,我想利用(利用)...
但我不知道如何 use/implement Java 中的那个库..
示例:
我有字符串数组 >> menjadikan, menjawab, penerbangan
你能帮我 Java 创建这样一个数组吗??
这是一个示例代码片段(基于 Lucene 测试代码),它使用印度尼西亚语词干分析器创建了一个 Lucene 分析器。
import java.io.IOException;
import java.io.Reader;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.Tokenizer;
import org.apache.lucene.analysis.core.KeywordTokenizer;
...
Analyzer a = new Analyzer() {
@Override
public TokenStreamComponents createComponents(
String fieldName, Reader reader) {
Tokenizer tokenizer = new KeywordTokenizer(reader);
return new TokenStreamComponents(tokenizer,
new IndonesianStemFilter(tokenizer));
}
};
您也可以直接实例化 IndonesianStemmer
,然后对单个单词调用 stem
方法。例如;
IndonesianStemmer stemmer = new IndonesianStemmer();
...
char[] chars = "menjadikan".toCharArray();
int len = stemmer.stem(chars, chars.length, false);
String stem = new String(chars, 0, len);
警告:以上代码未经测试。
这是 Lucene library 中的 class,我想利用(利用)... 但我不知道如何 use/implement Java 中的那个库..
示例: 我有字符串数组 >> menjadikan, menjawab, penerbangan
你能帮我 Java 创建这样一个数组吗??
这是一个示例代码片段(基于 Lucene 测试代码),它使用印度尼西亚语词干分析器创建了一个 Lucene 分析器。
import java.io.IOException;
import java.io.Reader;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.Tokenizer;
import org.apache.lucene.analysis.core.KeywordTokenizer;
...
Analyzer a = new Analyzer() {
@Override
public TokenStreamComponents createComponents(
String fieldName, Reader reader) {
Tokenizer tokenizer = new KeywordTokenizer(reader);
return new TokenStreamComponents(tokenizer,
new IndonesianStemFilter(tokenizer));
}
};
您也可以直接实例化 IndonesianStemmer
,然后对单个单词调用 stem
方法。例如;
IndonesianStemmer stemmer = new IndonesianStemmer();
...
char[] chars = "menjadikan".toCharArray();
int len = stemmer.stem(chars, chars.length, false);
String stem = new String(chars, 0, len);
警告:以上代码未经测试。