如何在 ELKI DBSCAN 结果中识别我的对象?

How to identify my objects in ELKI DBSCAN results?

我正在使用 ELKI GUI 运行 DBSCAN 算法。我的输入是一个 CSV 文件。我创建一个投影作为特征选择:

-dbc.filter transform.ProjectionFilter -projection NumericalFeatureSelection -projectionfilter.selectedattributes 1,2 

ELKI 给了我一些文件作为簇。这些文件仅包含投影属性和其他属性,例如 UserId 不存在。如何识别集群中每个对象的 UserId

最简单的方法是使用投影来删除不需要的列(实际上会删除这些列),而是将它们视为标签。因为这就是标签。

通常,如果您希望之后能够识别 点,最可靠的方法是为每个对象包含一个唯一标识符(对象标签)。

换句话说,使用

-parser.labelIndices 0

而不是您的过滤器(当然是选择您的标签列 - 假设您的用户 ID 在第 0 列)。