Weka 中 DBSCAN 实现的输出不一致

Inconsistent output from DBSCAN implementation in Weka

我在 Weka 中使用 DBSCAN 实现,它似乎根据 select "Use training set" 或 "Classes to clusters evaluation" 作为 'Cluster mode' 给我不同的结果。根据文档 here,selecting "Classes to clusters evaluation" 应该只更改报告的指标。

然而,对于 DBSCAN,我实际上看到了不同数量的集群。这是重现问题的方法:

  1. 加载 IRIS 数据集:Select "Preprocess" 选项卡,单击 "Open file",转到 Weka 安装中的 "data" 文件夹并加载 "iris"数据集。
  2. 转到 "Cluster" 选项卡并选择 DBSCAN。设置 epsilon=0.5 和 minpts=5.
  3. 在集群模式下,select 单选按钮 "Use training set" 并启动集群。查找字符串 "Number of generated clusters" - 这个数字对我来说是 3。
  4. 现在 select 将无线电模式更改为 "Classes to clusters evaluation" 并重新 运行 集群。我现在得到 1 个集群。

这是预期的行为吗?我错过了什么吗?

我似乎缺少的是 "Use training set" 设置 all 属性,包括 class-label, 被使用。如果我明确删除 class,结果匹配。