使用ELKI源码进行层次聚类

The use of ELKI source code for hierarchical clustering

我尝试使用 ELKI(索引结构支持的 KDD 应用程序开发环境)进行层次聚类。所以几天前,我导入了 ELKI 源代码(Maven 项目),然后 运行 miniGUI。

我的问题是:

  1. 我想对结果使用 ResultVisulizer。但是,我发现resulthandler中没有ResultVisulizer项。我应该怎么做才能使此 ResultVisulizer 项目列在此处?

  2. 我想看层次聚类的树状图。为此miniGUI需要设置哪些参数?

  1. 要启用 SVG 可视化工具,请启用 svg maven profile。 SVG 添加了大约 17 MB 的依赖项,因此我们决定将其作为可选模块。

  2. 目前ELKI中没有树状图可视化,因为这样的可视化不是很可扩展;有几十个实例,它们变得难以阅读。此外,在许多有趣的数据集上,距离(高度)过于相似,因此不幸的是,树状图也不是很有用。

    如果你提取簇并简化层次,ELKI将显示簇层次树,但它不会使用高度信息(出于上述原因,以及出于可读性原因). ELKI 具有强大的层次聚类聚类提取方法,这在 R 中是不可用的。

    欢迎您贡献树状图可视化;但请尽量让它对广泛的用户群有用,而不需要太多定制。

这里有一个来自 R (Source) 的例子,说明了为什么我不相信树状图(以及为什么它在我个人的优先级列表中排在较低的位置——其他人必须将其贡献给 ELKI):