Pandas 数据帧到数组以供进一步使用
Pandas dataframe to array for further use
我有一个数据框,其中包含销售 KPI(数量、商品编号和相应日期)的 csv
我需要将数据帧分成多个,每个包含一个文章编号的数据(例如 frame1=123,frame2=345 等等。
)
我怎样才能像这样动态拆分以便在 sklearns kmean 中进一步使用? (匹配不同的货号和他们的销售KPI)
非常感谢
您可以使用 groupBy
按文章编号分组。
grouped = df.groupby(['article_number'])
然后您可以使用
访问各个组
grouped.groups
或直接应用 grouped.sum(['quantity'])
之类的聚合函数来获取具有每个组各自值的新帧。
另请参阅User Guide。
我有一个数据框,其中包含销售 KPI(数量、商品编号和相应日期)的 csv 我需要将数据帧分成多个,每个包含一个文章编号的数据(例如 frame1=123,frame2=345 等等。 )
我怎样才能像这样动态拆分以便在 sklearns kmean 中进一步使用? (匹配不同的货号和他们的销售KPI) 非常感谢
您可以使用 groupBy
按文章编号分组。
grouped = df.groupby(['article_number'])
然后您可以使用
访问各个组grouped.groups
或直接应用 grouped.sum(['quantity'])
之类的聚合函数来获取具有每个组各自值的新帧。
另请参阅User Guide。