通过索引列创建新的数据框
Creating new Dataframe by Indexing Column
我似乎无法将这些点联系起来。我正在尝试做类似的事情
我有一个采用以下形式的数据框:
Origination
Orig Balance
Q1
3000
Q1
2000
Q1
4000
Q2
3000
Q2
3000
Q3
1000
Q3
4000
Q3
3000
我正在尝试创建一个如下所示的数据框:
Origination
Orig Balance
Q1
9000
Q2
6000
Q3
8000
我不想设置具体的参数,所以 df.loc[df['Origination'] == 'Q1', 'Orig Balance'].sum()
之类的东西对我不起作用。
您想先按 Origination
分组,然后 然后 取 Orig Balance
:
的总和
sums = df.groupby('Origination')['Orig Balance'].sum().reset_index()
输出:
>>> sums
Origination Orig Balance
0 Q1 9000
1 Q2 6000
2 Q3 8000
df.groupby(by=["Origination"]).sum()
可以使用总和
df.groupby('Origination').agg('sum').reset_index()
我似乎无法将这些点联系起来。我正在尝试做类似的事情
我有一个采用以下形式的数据框:
Origination | Orig Balance |
---|---|
Q1 | 3000 |
Q1 | 2000 |
Q1 | 4000 |
Q2 | 3000 |
Q2 | 3000 |
Q3 | 1000 |
Q3 | 4000 |
Q3 | 3000 |
我正在尝试创建一个如下所示的数据框:
Origination | Orig Balance |
---|---|
Q1 | 9000 |
Q2 | 6000 |
Q3 | 8000 |
我不想设置具体的参数,所以 df.loc[df['Origination'] == 'Q1', 'Orig Balance'].sum()
之类的东西对我不起作用。
您想先按 Origination
分组,然后 然后 取 Orig Balance
:
sums = df.groupby('Origination')['Orig Balance'].sum().reset_index()
输出:
>>> sums
Origination Orig Balance
0 Q1 9000
1 Q2 6000
2 Q3 8000
df.groupby(by=["Origination"]).sum()
可以使用总和
df.groupby('Origination').agg('sum').reset_index()