Pandas - 如何将重复项合并为一个包含多个列的项
Pandas - How to combine duplicate items into one with several columns
我有下面的 DataFrame
可以看到,ItemNo 1重复了3次,每一列都有一个值与之对应
我正在寻找一种方法来检查所有列,如果它们匹配,则将价格、销售额和库存作为一个条目,而不是三个。
任何帮助将不胜感激。
只需删除所有 NaN 实例并重新定义列名
df = df1.apply(lambda x: pd.Series(x.dropna().values), axis=1)
df.columns = ['ItemNo','Category','SIZE','Model','Customer','Week Date','<New col name>']
为了收敛到一行,你可以像这样使用groupby
df.groupby('ItemNo', as_index=False).first()
我有下面的 DataFrame
可以看到,ItemNo 1重复了3次,每一列都有一个值与之对应
我正在寻找一种方法来检查所有列,如果它们匹配,则将价格、销售额和库存作为一个条目,而不是三个。
任何帮助将不胜感激。
只需删除所有 NaN 实例并重新定义列名
df = df1.apply(lambda x: pd.Series(x.dropna().values), axis=1)
df.columns = ['ItemNo','Category','SIZE','Model','Customer','Week Date','<New col name>']
为了收敛到一行,你可以像这样使用groupby
df.groupby('ItemNo', as_index=False).first()