决定 Carrot2 中的簇大小设置
Deciding on cluster size setting in Carrot2
我正在使用 carrot2 的 STC(后缀树聚类)算法对一堆文档进行聚类。默认情况下,算法形成的最大簇数为 16。有没有办法决定生成的簇数?
下面是调用STC集群的代码。
ProcessingResult byDomainClusters = controller.process(documents, null, STCClusteringAlgorithm.class);
List<Cluster> clustersByDomain = byDomainClusters.getClusters();
ConsoleFormatter.displayClusters(clustersByDomain);
要获得更多集群,请尝试增加 maxClusters and maxBaseClusters parameters. Here's how to pass parameter values in Java code 的值。
不过聚类数偏少也可能是你输入数据的特点造成的(文档太少?)。要验证这一点,请尝试使用 Lingo 算法对数据进行聚类。
我正在使用 carrot2 的 STC(后缀树聚类)算法对一堆文档进行聚类。默认情况下,算法形成的最大簇数为 16。有没有办法决定生成的簇数?
下面是调用STC集群的代码。
ProcessingResult byDomainClusters = controller.process(documents, null, STCClusteringAlgorithm.class);
List<Cluster> clustersByDomain = byDomainClusters.getClusters();
ConsoleFormatter.displayClusters(clustersByDomain);
要获得更多集群,请尝试增加 maxClusters and maxBaseClusters parameters. Here's how to pass parameter values in Java code 的值。
不过聚类数偏少也可能是你输入数据的特点造成的(文档太少?)。要验证这一点,请尝试使用 Lingo 算法对数据进行聚类。