如何评估无监督异常检测

How to evaluate unsupervised anomaly detection

我正在尝试通过使用机器学习预测连续值来解决回归问题。我有一个由 6 个浮点列组成的数据集。

数据来自低价传感器,这说明我们很可能会拥有可以被认为与众不同的价值。为了解决这个问题,在预测我的连续目标之前,我会预测数据异常,并将他用作数据过滤器,但是我拥有的数据没有标记,这意味着我有无监督异常检测问题。

用于此任务的算法是局部离群因子、一个Class SVM、孤立森林、椭圆包络和DBSCAN。

拟合这些算法后,需要对其进行评估以选择最佳算法。 谁能知道如何评估用于异常检测的无监督算法?

唯一的方法是生成合成异常,这意味着在了解典型异常值的情况下自行引入异常值。