Elki 中的评估

Evaluation in Elki

我知道ELKI目前只包含无监督异常值检测方法，因此Elki不划分训练集和测试集的输入数据。但是，我已经看到评估在可用时超过了少数 class。我想知道：

elki 是否使用所有输入数据进行评估？
运行时是考虑评估还是只考虑训练时间？
评估是否考虑异常值分数来估计假阳性率和真阳性率以评估排名？
例如，在LOF算法中，假设正常class中的实例具有高LOF分数。在评估中会被认为是假阳性还是真阳性？

谢谢！

是的，所有输入都用于无监督方法。

标签一定不能用于运行算法，它们仅在评估时使用。
报告的运行时间是针对每个算法单独报告的。
这要看你的评价了。大多数措施（例如 ROC AUC）只会考虑排名。要评估实际分数，您首先需要对其进行归一化。有关考虑（标准化）分数的衡量标准，请参阅

E. Schubert, R. Wojdanowski, A. Zimek, H.-P. Kriegel
On Evaluation of Outlier Rankings and Outlier Scores
In Proceedings of the 12th SIAM International Conference on Data Mining (SDM), Anaheim, CA: 1047–1058, 2012.
真阳性和假阳性需要二元决定。请参阅 ROC AUC，了解一种不需要指定阈值来做出二元决策的方法，而是评估所有可能的阈值。