聚类异常检测?
anomaly detection with clustering?
根据 Andrew Ng 的 coursera 讲座,其中一种异常检测算法是使用多元高斯构建概率密度。
如果数据显示集群结构(而不是单个块)怎么办?在这种情况下,我们是否求助于无监督聚类来构建密度?如果是,该怎么做?是否有其他系统的方法来发现这种情况是否存在?
您可以只使用常规 GMM 并使用可能性阈值来识别异常值。不适合模型的点是异常值。
只要您的数据确实由高斯分布组成,这就可以正常工作。
此外,集群相当昂贵。通常直接使用 KNN 或 LOF 或 LOOP 等非参数异常值模型会更快。
根据 Andrew Ng 的 coursera 讲座,其中一种异常检测算法是使用多元高斯构建概率密度。
如果数据显示集群结构(而不是单个块)怎么办?在这种情况下,我们是否求助于无监督聚类来构建密度?如果是,该怎么做?是否有其他系统的方法来发现这种情况是否存在?
您可以只使用常规 GMM 并使用可能性阈值来识别异常值。不适合模型的点是异常值。
只要您的数据确实由高斯分布组成,这就可以正常工作。
此外,集群相当昂贵。通常直接使用 KNN 或 LOF 或 LOOP 等非参数异常值模型会更快。