Pandas 相当于 "Select x from y groupby x"?
Pandas equiv of "Select x from y groupby x"?
我有这个代码
dfUsers = df.groupby('UserID').count()
这会返回一个用户 ID 列表和计数。它可以满足我的需要,但想知道是否有更好的代码可以从用户出现不止一次的数据框中仅返回用户 ID 的唯一列表,而不是返回计数?
SQL 等效项是:Select 来自数据帧组的用户 ID
使用unique
:
dfUsers = df['UserID'].unique()
或者,您可以使用 drop_duplicates
which returns a DataFrame
:
dfUsers = df['UserID'].drop_duplicates()
我有这个代码
dfUsers = df.groupby('UserID').count()
这会返回一个用户 ID 列表和计数。它可以满足我的需要,但想知道是否有更好的代码可以从用户出现不止一次的数据框中仅返回用户 ID 的唯一列表,而不是返回计数?
SQL 等效项是:Select 来自数据帧组的用户 ID
使用unique
:
dfUsers = df['UserID'].unique()
或者,您可以使用 drop_duplicates
which returns a DataFrame
:
dfUsers = df['UserID'].drop_duplicates()