在 Solr 上标记 Carrot2 Lingo Clustering 的集群标签

Tokenizing cluster labels of Carrot2 Lingo Clustering on Solr

我使用 Carrot2 Lingo 聚类算法对我的 Solr 搜索结果进行聚类。现在我想进一步处理聚类标签,因此我需要对标签进行标记,以便每个标签一个一个地获取它们。

是否有某种 post 分词器可用于实现此目的,还是我必须自己处理结果?

感谢您的帮助!

蒂姆

没有专门的分词器,您需要自己分词。在大多数情况下,在白色 space 上标记将是一个不错的选择。