如何 select 不规则数据框中的最后一个值
how to select the last value in a irregular data frame
我有一个非常大的数据框,其中包含一些产品的订单和参考。此参考具有定期更新,因此对于同一产品,数据框中有很多行。我想为每个参考选择最后更新,但我不知道为什么。
作为参考,例如有 10 个更新,另一个,34 个,所以没有赞助人...
有什么想法吗?
我想应该是这样的 -
df.sort_values("update_date",ascending=False).groupby("reference").first()
您首先按 update_date 降序对数据框进行排序,然后按 reference
对其进行分组,并为每个参考选择第一条记录
你可以像这样使用 func iget :
df['column'].iget(-1);
或
df.iloc[-1:]
我有一个非常大的数据框,其中包含一些产品的订单和参考。此参考具有定期更新,因此对于同一产品,数据框中有很多行。我想为每个参考选择最后更新,但我不知道为什么。
作为参考,例如有 10 个更新,另一个,34 个,所以没有赞助人...
有什么想法吗?
我想应该是这样的 -
df.sort_values("update_date",ascending=False).groupby("reference").first()
您首先按 update_date 降序对数据框进行排序,然后按 reference
对其进行分组,并为每个参考选择第一条记录
你可以像这样使用 func iget :
df['column'].iget(-1);
或 df.iloc[-1:]