如果有重复项,如何从 pandas groupby 中删除列?
How can I remove a column from a pandas groupby if there are duplicates?
我运行一个df.groupby(['join', 'churn']).count()
它return是这样的:
join churn
2016-05 2016-05 1
2016-06 5
2017-07 2
2018-08 1
2016-06 2016-06 2
2016-07 9
2016-11 1
2017-06 2
我如何进一步处理这些数据,以便在加入 == 流失时它不会 return 一行?
我想要的:
join churn
2016-05 2016-06 5
2017-07 2
2018-08 1
2016-06 2016-07 9
2016-11 1
2017-06 2
在 groupby
之前过滤
df.query('join!=churn').groupby(['join', 'churn']).count()
您可以先筛选:
mask = df['join'] != df['churn']
df[mask].groupby(['join', 'churn']).count()
我运行一个df.groupby(['join', 'churn']).count()
它return是这样的:
join churn
2016-05 2016-05 1
2016-06 5
2017-07 2
2018-08 1
2016-06 2016-06 2
2016-07 9
2016-11 1
2017-06 2
我如何进一步处理这些数据,以便在加入 == 流失时它不会 return 一行?
我想要的:
join churn
2016-05 2016-06 5
2017-07 2
2018-08 1
2016-06 2016-07 9
2016-11 1
2017-06 2
在 groupby
df.query('join!=churn').groupby(['join', 'churn']).count()
您可以先筛选:
mask = df['join'] != df['churn']
df[mask].groupby(['join', 'churn']).count()