Python Pandas : 按一列分组,查看所有列的内容?
Python Pandas : Group by one column and see the content of all columns?
我有一个这样的数据框:
org group count
org1 1 2
org2 1 2
org3 2 1
org4 3 3
org5 3 3
org6 3 3
这就是我想要的,来自 'group' 列的每个唯一组的一个条目:
org group count
org1 1 2
org3 2 1
org4 3 3
我正在按命令使用以下组,但我仍然可以看到所有行:
df.groupby('group').head()
有没有人知道如何获得预期的结果?
你可以在 group
上 drop_duplicates
吗?
In [172]: df.drop_duplicates('group')
Out[172]:
org group count
0 org1 1 2
2 org3 2 1
3 org4 3 3
此外,df.drop_duplicates(['group', 'count'])
在这种情况下有效。
但是,这可能不是最好的一种非常灵活的方法。 @EdChum 的 提供了灵活性的指导。
如果您想 return 将分组索引返回为列,请调用 first
on the groupby
object and optionally call reset_index
:
In [448]:
df.groupby('group').first().reset_index()
Out[448]:
group org count
0 1 org1 2
1 2 org3 1
2 3 org4 3
我有一个这样的数据框:
org group count
org1 1 2
org2 1 2
org3 2 1
org4 3 3
org5 3 3
org6 3 3
这就是我想要的,来自 'group' 列的每个唯一组的一个条目:
org group count
org1 1 2
org3 2 1
org4 3 3
我正在按命令使用以下组,但我仍然可以看到所有行:
df.groupby('group').head()
有没有人知道如何获得预期的结果?
你可以在 group
上 drop_duplicates
吗?
In [172]: df.drop_duplicates('group')
Out[172]:
org group count
0 org1 1 2
2 org3 2 1
3 org4 3 3
此外,df.drop_duplicates(['group', 'count'])
在这种情况下有效。
但是,这可能不是最好的一种非常灵活的方法。 @EdChum 的
如果您想 return 将分组索引返回为列,请调用 first
on the groupby
object and optionally call reset_index
:
In [448]:
df.groupby('group').first().reset_index()
Out[448]:
group org count
0 1 org1 2
1 2 org3 1
2 3 org4 3