使用 cluster-algorithms-java-alpha 库 java 来确定 Silhouette Index

Using cluster-algorithms-java-alpha library java to determine Silhouette Index

我正在尝试使用集群算法-java-alpha 库中的源代码,这是 link“http://code.google.com/p/cluster-algorithms-java-alpha/source/browse/tags/rewritepending/src/validationIndices/SilhouetteIndex.java?r=6”。

但我真的很困惑如何获取 "calculateIndex(Dataset clusteredData)" 方法的输入。我会将此代码与 java ml 库集成。 因此,我将使用 java ml 库应用 k-means 聚类,并使用上面的代码 link 来确定正确的聚类数量,但我的问题是如何获取输入类型 "Dataset clusteredData"有什么建议吗?

定义了用于读取文件内容的 InputReader:

https://code.google.com/p/cluster-algorithms-java-alpha/source/browse/tags/rewritepending/src/input/InputReader.java?r=6

如果它不能满足您的需求,您可以将其用作模板来初始化您自己的数据集