有没有办法从 ELKI 将可达性列表输入 Optics Xi 并获取集群?

Is there a way to input a reachability list into Optics Xi from ELKI and get clusters?

我在通过 Optics 算法将数据正确输入 ELKI 运行 时遇到了一些麻烦,但是使用 Optics 的 R 实现,我可以轻松获得可达距离列表。我可以将它们写入这样的文件。 (索引,距离)

1 信息

2 0.5

3 0.9 ...

我想找到由局部最小值分隔的集群。我认为 ELKI 软件中的 Optics Xi 算法可以做到这一点,但由于我在导入数据时遇到问题,我无法使用它。

使用 Optics 论文中的伪代码用另一种语言编写 Optics 聚类提取算法会更容易吗?我认为最基本的是,当它们彼此相邻时,它只是将索引聚集在一起,并且不会减少到新的局部最小值。

谢谢

您可以尝试实现接口 OPTICSTypeAlgorithm, which largely means reading your data and storing it in an object of type ClusterOrder

但是,ELKI 包含一个稍微高级的 OPTICS 版本,使用 OPTICSXi 会产生更好的结果。详细信息最终将作为技术报告发布。您从 R 实现中获得的数据不足以校正 OPTICS 图中的一些常见伪影。

请使用ELKI中的OPTICS版本。尝试 Cover 树索引(它非常快速且易于使用)。避免在输入数据中使用 ID 列,或告诉解析器哪一列是 ID 列。