如何使用双变量箱线图从数据集中删除异常值
How to remove outliers from a dataset using bivariate boxplot
我有一个由多个变量组成的数据集(见下文),其中两个是 'manu' 和 'popul',它们都包含数值。
根据这些数据,我使用 'manu' 和 'popul' 绘制了一个双变量箱线图,以便我可以找到这两个变量之间的异常值。这是它的样子:
然后从这个图中我可以看到有一些异常值,我能够使用下面的代码识别哪些值是异常值,我还将显示哪些值是异常值:
我想知道的是我现在如何获取包含这些值的行并将它们从数据集中删除?
提前致谢。
您可以像这样提取所需的子集:
我有一个由多个变量组成的数据集(见下文),其中两个是 'manu' 和 'popul',它们都包含数值。
根据这些数据,我使用 'manu' 和 'popul' 绘制了一个双变量箱线图,以便我可以找到这两个变量之间的异常值。这是它的样子:
然后从这个图中我可以看到有一些异常值,我能够使用下面的代码识别哪些值是异常值,我还将显示哪些值是异常值:
我想知道的是我现在如何获取包含这些值的行并将它们从数据集中删除?
提前致谢。
您可以像这样提取所需的子集: