从 python 中的列表列表中删除异常值
Removing outliers from a list of list in python
我在 Python 中有这个数据,这是一个列表列表。我想做的是在第二列中找到任何异常值,即数据 [0][1]、数据[1][1] 等,然后从数据中删除该列表。例如这里,显然 90 是离群值,我想删除包含 90 的列表,即从数据中删除 [0.5,80]。我试过这个,但我认为最后一部分不对。知道如何使用列表理解来做到这一点吗?
data= [[0.5549872122762148, 41.176470588235304],
[0.575197889182058, 33.55145118733509],
[0.5561224489795918, 38.60204081632651],
[0.5, 90]]
data_median = np.median(data, axis = 0)
data_std = np.std(data, axis = 0)
cut_off = data_std * 3
lower, upper = data_median - cut_off, data_median + cut_off
dataout = [[y for y in x if y if y < lower or y > upper] for x in data]
你可以这样做:
dataout = [[x,y] for x,y in data if (lower[0] < x < upper[0]) and
(lower[1] < y < upper[1])]
但是你的cut_off
太任性了。
尝试使用:
cut_off = data_std * 1
我在 Python 中有这个数据,这是一个列表列表。我想做的是在第二列中找到任何异常值,即数据 [0][1]、数据[1][1] 等,然后从数据中删除该列表。例如这里,显然 90 是离群值,我想删除包含 90 的列表,即从数据中删除 [0.5,80]。我试过这个,但我认为最后一部分不对。知道如何使用列表理解来做到这一点吗?
data= [[0.5549872122762148, 41.176470588235304],
[0.575197889182058, 33.55145118733509],
[0.5561224489795918, 38.60204081632651],
[0.5, 90]]
data_median = np.median(data, axis = 0)
data_std = np.std(data, axis = 0)
cut_off = data_std * 3
lower, upper = data_median - cut_off, data_median + cut_off
dataout = [[y for y in x if y if y < lower or y > upper] for x in data]
你可以这样做:
dataout = [[x,y] for x,y in data if (lower[0] < x < upper[0]) and
(lower[1] < y < upper[1])]
但是你的cut_off
太任性了。
尝试使用:
cut_off = data_std * 1