从 solr 文档(lucene、luke)中检索分析过的带状疱疹

retrieve analysed shingles from solr doc (lucene, luke)

我创建了一个solr字段如下:

<analyzer type="index">
    <tokenizer class="solr.LowerCaseTokenizerFactory"/>              
    <filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
    <filter class="solr.ShingleFilterFactory" minShingleSize="3" maxShingleSize="5"/>
    <filter class="solr.PatternReplaceFilterFactory" pattern=".*_.*" replacement=""/>
</analyzer>

它创建了具有预期结果的文档。我想获取我无法找到的特定过滤器查询的所有带状疱疹。我尝试使用 luke 获取索引,但它给了我所有不是来自过滤器查询的带状疱疹。有没有办法得到这样的数据?

该字段的分面将为您提供所有令牌以及令牌出现次数的计数。这可能就足够了。

如果您这样做是为了测试单个输入,您也可以在 Web Admin UI 的分析屏幕中尝试。