Pandas 在 groupby.apply(..) 之后删除组列
Pandas drop group column after groupby.apply(..)
uid iid val
uid
1 1 1 5 5.5
2 3 1 4 3.5
2 2 1 4 3.5
2 7 1 4 3.5
2 9 1 4 3.5
2 11 1 4 3.5
从上面的数据框中,我想删除第一列,即:
uid
1
2
2
2
2
2
并提取
uid iid val
1 1 5 5.5
3 1 4 3.5
2 1 4 3.5
7 1 4 3.5
9 1 4 3.5
11 1 4 3.5
有人可以帮忙吗?
使用reset_index
or droplevel
:
df = df.reset_index(level=0, drop=True)
df = df.reset_index(level='uid', drop=True)
或者:
df.index = df.index.droplevel(0)
您可以通过将 group_keys=False
传递给 groupby
来避免首先在索引中包含 uid
df.groupby('uid', group_keys=False).apply(lambda x: x.tail(len(x) // 5))
uid iid val
4 1 5 5.5
您可以将 as_index
设置为 False
以从 df 分组中删除索引。
df.groupby('uid', as_index=False)
uid iid val
uid
1 1 1 5 5.5
2 3 1 4 3.5
2 2 1 4 3.5
2 7 1 4 3.5
2 9 1 4 3.5
2 11 1 4 3.5
从上面的数据框中,我想删除第一列,即:
uid
1
2
2
2
2
2
并提取
uid iid val
1 1 5 5.5
3 1 4 3.5
2 1 4 3.5
7 1 4 3.5
9 1 4 3.5
11 1 4 3.5
有人可以帮忙吗?
使用reset_index
or droplevel
:
df = df.reset_index(level=0, drop=True)
df = df.reset_index(level='uid', drop=True)
或者:
df.index = df.index.droplevel(0)
您可以通过将 group_keys=False
传递给 groupby
uid
df.groupby('uid', group_keys=False).apply(lambda x: x.tail(len(x) // 5))
uid iid val
4 1 5 5.5
您可以将 as_index
设置为 False
以从 df 分组中删除索引。
df.groupby('uid', as_index=False)