R 中的异常值标签或评分

Label or score outliers in R

我正在寻找 R 中一些易于使用的算法来标记(异常值或非异常值)或按行对异常值进行评分(比如 7.5)。意思是,我有一个包含多行的矩阵 m,我想识别与其他行相比代表异常值的行。

m <- matrix( data = c(1,1,1,0,0,0,1,0,1), ncol = 3 )

为了说明更多,我想将矩阵中的所有(完整)行相互比较以发现异常值。

这是我几年前写的一些非常简单的异常值检测(使用箱线图统计或数据分位数)。

Outliers

但是,如前所述,如果您更准确地描述您的问题,将会很有帮助。

编辑:

你还说你想要 row-wise 离群值。您的意思是说您有兴趣识别变量中的整行与观察值(通常是这样做的)吗?如果是这样,您将需要使用某种距离度量,但您选择的度量将取决于您的数据。