根据 "not in" 条件从数据框中删除行
dropping rows from dataframe based on a "not in" condition
当日期列的值在日期列表中时,我想从 pandas 数据框中删除行。以下代码不起作用:
a=['2015-01-01' , '2015-02-01']
df=df[df.datecolumn not in a]
我收到以下错误:
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
您可以使用 Series.isin
:
df = df[~df.datecolumn.isin(a)]
虽然错误消息表明可以使用 all()
或 any()
,但它们仅在您希望将结果简化为单个布尔值时才有用。然而,这不是您现在要尝试做的,这是针对外部列表测试系列中每个值的成员资格,并保持结果完整(即,一个布尔系列,然后将用于切片原始 DataFrame ).
您可以在 Gotchas 中阅读更多相关信息。
您可以使用 pandas.Dataframe.isin
.
pandas.Dateframe.isin
将 return 布尔值取决于每个元素是否在列表 a
内。然后,您使用 ~
反转它以将 True
转换为 False
,反之亦然。
import pandas as pd
a = ['2015-01-01' , '2015-02-01']
df = pd.DataFrame(data={'date':['2015-01-01' , '2015-02-01', '2015-03-01' , '2015-04-01', '2015-05-01' , '2015-06-01']})
print(df)
# date
#0 2015-01-01
#1 2015-02-01
#2 2015-03-01
#3 2015-04-01
#4 2015-05-01
#5 2015-06-01
df = df[~df['date'].isin(a)]
print(df)
# date
#2 2015-03-01
#3 2015-04-01
#4 2015-05-01
#5 2015-06-01
当日期列的值在日期列表中时,我想从 pandas 数据框中删除行。以下代码不起作用:
a=['2015-01-01' , '2015-02-01']
df=df[df.datecolumn not in a]
我收到以下错误:
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
您可以使用 Series.isin
:
df = df[~df.datecolumn.isin(a)]
虽然错误消息表明可以使用 all()
或 any()
,但它们仅在您希望将结果简化为单个布尔值时才有用。然而,这不是您现在要尝试做的,这是针对外部列表测试系列中每个值的成员资格,并保持结果完整(即,一个布尔系列,然后将用于切片原始 DataFrame ).
您可以在 Gotchas 中阅读更多相关信息。
您可以使用 pandas.Dataframe.isin
.
pandas.Dateframe.isin
将 return 布尔值取决于每个元素是否在列表 a
内。然后,您使用 ~
反转它以将 True
转换为 False
,反之亦然。
import pandas as pd
a = ['2015-01-01' , '2015-02-01']
df = pd.DataFrame(data={'date':['2015-01-01' , '2015-02-01', '2015-03-01' , '2015-04-01', '2015-05-01' , '2015-06-01']})
print(df)
# date
#0 2015-01-01
#1 2015-02-01
#2 2015-03-01
#3 2015-04-01
#4 2015-05-01
#5 2015-06-01
df = df[~df['date'].isin(a)]
print(df)
# date
#2 2015-03-01
#3 2015-04-01
#4 2015-05-01
#5 2015-06-01