pandas DataFrame 中按日期(在索引中)的加权平均分组(每列不同的操作)
Weighted average grouping by date (in index) in pandas DataFrame (different operations per column)
我有一个数据框,每天有几行,一个 'mass' 列和一个“%”值,需要根据质量计算为加权平均值;和质量列总和...创建一个包含所有值的新数据框。
d = {'date': [1, 1, 1, 2, 2], 'mass': [3, 40, 10, 12, 15], '%': [0.4, 0.7, 0.9, 0.1, 0.2]}
df = pd.DataFrame(data=d)
df.set_index('date')
我需要这样的输出:
date(index) | mass | %
1 | 53 | 0.72
2 | 27 | 0.46
作为加权平均值计算的“%”:
0.72 = ((0.4 * 3) + (0.7 * 40) + (0.9 * 10))/(3 + 40 +10)
而质量每天一笔。
将 2 列相乘,然后 groupby 与聚合,然后相除:
#df = df.set_index('date')
out = df.assign(k=df['mass'].mul(df['%']))[['mass','k']].sum(level=0)
out['%'] = out.pop('k').div(out['mass'])
print(out)
mass %
date
1 53 0.720755
2 27 0.155556 #<- Note that ((12*.1)+(15*.2))/(15+12) != 0.46
我有一个数据框,每天有几行,一个 'mass' 列和一个“%”值,需要根据质量计算为加权平均值;和质量列总和...创建一个包含所有值的新数据框。
d = {'date': [1, 1, 1, 2, 2], 'mass': [3, 40, 10, 12, 15], '%': [0.4, 0.7, 0.9, 0.1, 0.2]}
df = pd.DataFrame(data=d)
df.set_index('date')
我需要这样的输出:
date(index) | mass | %
1 | 53 | 0.72
2 | 27 | 0.46
作为加权平均值计算的“%”:
0.72 = ((0.4 * 3) + (0.7 * 40) + (0.9 * 10))/(3 + 40 +10)
而质量每天一笔。
将 2 列相乘,然后 groupby 与聚合,然后相除:
#df = df.set_index('date')
out = df.assign(k=df['mass'].mul(df['%']))[['mass','k']].sum(level=0)
out['%'] = out.pop('k').div(out['mass'])
print(out)
mass %
date
1 53 0.720755
2 27 0.155556 #<- Note that ((12*.1)+(15*.2))/(15+12) != 0.46