如何评估无监督异常检测

How to evaluate unsupervised anomaly detection

我正在尝试通过使用机器学习预测连续值来解决回归问题。我有一个由 6 个浮点列组成的数据集。

数据来自低价传感器，这说明我们很可能会拥有可以被认为与众不同的价值。为了解决这个问题，在预测我的连续目标之前，我会预测数据异常，并将他用作数据过滤器，但是我拥有的数据没有标记，这意味着我有无监督异常检测问题。

用于此任务的算法是局部离群因子、一个Class SVM、孤立森林、椭圆包络和DBSCAN。

拟合这些算法后，需要对其进行评估以选择最佳算法。谁能知道如何评估用于异常检测的无监督算法？

唯一的方法是生成合成异常，这意味着在了解典型异常值的情况下自行引入异常值。