ELKI:运行 具有不同 k 的 LOF
ELKI: Running LOF with varying k
我可以 运行 通过 ELKI 改变 k 的 LOF 以便比较哪个 k 最好吗?
一般选择k,然后就可以看到ROCAUC了。我想为数据集取出最好的k,所以我需要比较多个运行。我可以比手动更改 k 的值并执行 运行s 更容易吗?例如,我想比较所有 k=[1-100].
谢谢
Greedy Ensemble 展示了如何运行 一次有效地对整个 k 范围进行离群值检测方法(通过只计算一次最近邻,速度会快很多!)使用ComputeKNNOutlierScores
应用程序包含在 ELKI 中。
应用程序 EvaluatePrecomputedOutlierScores
可用于通过多项措施批量评估这些结果。
这是我们用于发布的内容
G. O. Campos, A. Zimek, J. Sander, R. J. G. B. Campello, B. Micenková, E. Schubert, I. Assent and M. E. Houle
On the Evaluation of Unsupervised Outlier Detection: Measures, Datasets, and an Empirical Study
Data Mining and Knowledge Discovery 30(4): 891-927, 2016, DOI: 10.1007/s10618-015-0444-8
在 supplementary material website 上,您可以查找许多标准数据集的最佳结果,也可以下载原始结果。
但请注意,离群值检测质量结果往往没有定论。在一个数据集上,一种方法表现最好,在另一个数据集上,另一种方法表现最好。没有明确的赢家,因为数据集非常多样化。
我可以 运行 通过 ELKI 改变 k 的 LOF 以便比较哪个 k 最好吗?
一般选择k,然后就可以看到ROCAUC了。我想为数据集取出最好的k,所以我需要比较多个运行。我可以比手动更改 k 的值并执行 运行s 更容易吗?例如,我想比较所有 k=[1-100].
谢谢
Greedy Ensemble 展示了如何运行 一次有效地对整个 k 范围进行离群值检测方法(通过只计算一次最近邻,速度会快很多!)使用ComputeKNNOutlierScores
应用程序包含在 ELKI 中。
应用程序 EvaluatePrecomputedOutlierScores
可用于通过多项措施批量评估这些结果。
这是我们用于发布的内容
G. O. Campos, A. Zimek, J. Sander, R. J. G. B. Campello, B. Micenková, E. Schubert, I. Assent and M. E. Houle
On the Evaluation of Unsupervised Outlier Detection: Measures, Datasets, and an Empirical Study
Data Mining and Knowledge Discovery 30(4): 891-927, 2016, DOI: 10.1007/s10618-015-0444-8
在 supplementary material website 上,您可以查找许多标准数据集的最佳结果,也可以下载原始结果。
但请注意,离群值检测质量结果往往没有定论。在一个数据集上,一种方法表现最好,在另一个数据集上,另一种方法表现最好。没有明确的赢家,因为数据集非常多样化。