计算数据框列中间隔的标准偏差

Calculate standard deviation for intervals in dataframe column

我想计算非滚动间隔的标准偏差。

我有一个这样的 df:

value std year
  3   nan 2001
  2   nan 2001
  4   nan 2001
 19   nan 2002
 23   nan 2002
 34   nan 2002

等等。我只想计算每年的标准偏差,并将其保存在“std”中相应行的每个单元格中。我每年都有相同数量的数据,因此间隔的长度永远不会改变。

我已经试过了:

df["std"] = df.groupby("year").std()

但是由于右边给出了一个新的数据框来计算每列的标准差,这显然是行不通的。

非常感谢大家的支持!

IIUC:

通过transform()方法尝试:

df['std']=df.groupby("year")['value'].transform('std')

如果要计算多列的标准差,则:

df[['std1','std2']]=df.groupby("year")[['column1','column2']].transform('std')