如何评估无监督异常检测
How to evaluate unsupervised anomaly detection
我正在尝试通过使用机器学习预测连续值来解决回归问题。我有一个由 6 个浮点列组成的数据集。
数据来自低价传感器,这说明我们很可能会拥有可以被认为与众不同的价值。为了解决这个问题,在预测我的连续目标之前,我会预测数据异常,并将他用作数据过滤器,但是我拥有的数据没有标记,这意味着我有无监督异常检测问题。
用于此任务的算法是局部离群因子、一个Class SVM、孤立森林、椭圆包络和DBSCAN。
拟合这些算法后,需要对其进行评估以选择最佳算法。
谁能知道如何评估用于异常检测的无监督算法?
唯一的方法是生成合成异常,这意味着在了解典型异常值的情况下自行引入异常值。
我正在尝试通过使用机器学习预测连续值来解决回归问题。我有一个由 6 个浮点列组成的数据集。
数据来自低价传感器,这说明我们很可能会拥有可以被认为与众不同的价值。为了解决这个问题,在预测我的连续目标之前,我会预测数据异常,并将他用作数据过滤器,但是我拥有的数据没有标记,这意味着我有无监督异常检测问题。
用于此任务的算法是局部离群因子、一个Class SVM、孤立森林、椭圆包络和DBSCAN。
拟合这些算法后,需要对其进行评估以选择最佳算法。 谁能知道如何评估用于异常检测的无监督算法?
唯一的方法是生成合成异常,这意味着在了解典型异常值的情况下自行引入异常值。