过滤以识别 Python 中的异常值
Filter to identify outliers in Python
我正在尝试删除落在 2 个范围内的离群值,但一直收到错误。我试过布尔 & 和 |字符 np.logical_or 和 np.logical_and,以及 .any() 或 .all(),但无济于事。有人可以告诉我我在这里做错了什么吗?这是显示异常值的箱线图:
这是我试图用来过滤异常值的代码:
提前感谢您的反馈。
正如评论所指出的,您可以像这样计算位掩码 rm_filter
:
rm_filter = (df['RM'] >=7.75) | (df['RM'] <=4.75)
并且应该能够删除这些记录,例如:
df_rm_outlier_rem = df[~rm_filter]
波浪号 ~ 否定过滤器。
我正在尝试删除落在 2 个范围内的离群值,但一直收到错误。我试过布尔 & 和 |字符 np.logical_or 和 np.logical_and,以及 .any() 或 .all(),但无济于事。有人可以告诉我我在这里做错了什么吗?这是显示异常值的箱线图:
这是我试图用来过滤异常值的代码:
提前感谢您的反馈。
正如评论所指出的,您可以像这样计算位掩码 rm_filter
:
rm_filter = (df['RM'] >=7.75) | (df['RM'] <=4.75)
并且应该能够删除这些记录,例如:
df_rm_outlier_rem = df[~rm_filter]
波浪号 ~ 否定过滤器。