Python/Pandas:创建摘要 table
Python/Pandas: create summary table
在 python pandas 数据框 "df" 中,我有以下列:
user_id | song_id | song_duration | song_title | artist | listen_count
许多用户可能听过同一首歌 - 因此这首歌在 table 中并不是独一无二的。我想创建第二个仅包含歌曲信息的数据框(具有独特的 song_ids)。
song_id | song_title | artist
我设法用 song_id 和 song_title 创建了一个 table。
song_df = df.groupby('song_id').song_title.first()
如何将 "artist" 列添加到其中?
这不起作用:
song_df = df.groupby('song_id').df['song_title','artist'].first()
AttributeError: 'DataFrameGroupBy' object has no attribute 'df'
IIUC 尝试跳过 .df
:
df.groupby('song_id')['song_title','artist'].first()
您可以只删除所选列的重复项
song_df = df[['song_id','song_title','artist']].drop_duplicates()
在 python pandas 数据框 "df" 中,我有以下列:
user_id | song_id | song_duration | song_title | artist | listen_count
许多用户可能听过同一首歌 - 因此这首歌在 table 中并不是独一无二的。我想创建第二个仅包含歌曲信息的数据框(具有独特的 song_ids)。
song_id | song_title | artist
我设法用 song_id 和 song_title 创建了一个 table。
song_df = df.groupby('song_id').song_title.first()
如何将 "artist" 列添加到其中?
这不起作用:
song_df = df.groupby('song_id').df['song_title','artist'].first()
AttributeError: 'DataFrameGroupBy' object has no attribute 'df'
IIUC 尝试跳过 .df
:
df.groupby('song_id')['song_title','artist'].first()
您可以只删除所选列的重复项
song_df = df[['song_id','song_title','artist']].drop_duplicates()