决定 Carrot2 中的簇大小设置

Deciding on cluster size setting in Carrot2

我正在使用 carrot2 的 STC(后缀树聚类)算法对一堆文档进行聚类。默认情况下,算法形成的最大簇数为 16。有没有办法决定生成的簇数?

下面是调用STC集群的代码。

ProcessingResult byDomainClusters = controller.process(documents, null, STCClusteringAlgorithm.class);
List<Cluster> clustersByDomain = byDomainClusters.getClusters();
ConsoleFormatter.displayClusters(clustersByDomain);

要获得更多集群,请尝试增加 maxClusters and maxBaseClusters parameters. Here's how to pass parameter values in Java code 的值。

不过聚类数偏少也可能是你输入数据的特点造成的(文档太少?)。要验证这一点,请尝试使用 Lingo 算法对数据进行聚类。