聚类异常检测?

anomaly detection with clustering?

根据 Andrew Ng 的 coursera 讲座,其中一种异常检测算法是使用多元高斯构建概率密度。

如果数据显示集群结构(而不​​是单个块)怎么办?在这种情况下,我们是否求助于无监督聚类来构建密度?如果是,该怎么做?是否有其他系统的方法来发现这种情况是否存在?

您可以只使用常规 GMM 并使用可能性阈值来识别异常值。不适合模型的点是异常值。

只要您的数据确实由高斯分布组成,这就可以正常工作。

此外,集群相当昂贵。通常直接使用 KNN 或 LOF 或 LOOP 等非参数异常值模型会更快。