计算数据框列中间隔的标准偏差
Calculate standard deviation for intervals in dataframe column
我想计算非滚动间隔的标准偏差。
我有一个这样的 df:
value std year
3 nan 2001
2 nan 2001
4 nan 2001
19 nan 2002
23 nan 2002
34 nan 2002
等等。我只想计算每年的标准偏差,并将其保存在“std”中相应行的每个单元格中。我每年都有相同数量的数据,因此间隔的长度永远不会改变。
我已经试过了:
df["std"] = df.groupby("year").std()
但是由于右边给出了一个新的数据框来计算每列的标准差,这显然是行不通的。
非常感谢大家的支持!
IIUC:
通过transform()
方法尝试:
df['std']=df.groupby("year")['value'].transform('std')
或
如果要计算多列的标准差,则:
df[['std1','std2']]=df.groupby("year")[['column1','column2']].transform('std')
我想计算非滚动间隔的标准偏差。
我有一个这样的 df:
value std year
3 nan 2001
2 nan 2001
4 nan 2001
19 nan 2002
23 nan 2002
34 nan 2002
等等。我只想计算每年的标准偏差,并将其保存在“std”中相应行的每个单元格中。我每年都有相同数量的数据,因此间隔的长度永远不会改变。
我已经试过了:
df["std"] = df.groupby("year").std()
但是由于右边给出了一个新的数据框来计算每列的标准差,这显然是行不通的。
非常感谢大家的支持!
IIUC:
通过transform()
方法尝试:
df['std']=df.groupby("year")['value'].transform('std')
或
如果要计算多列的标准差,则:
df[['std1','std2']]=df.groupby("year")[['column1','column2']].transform('std')