在 groupby 和 loc 之后存储值

Question

使用 df 到 select 两列 col_1 和 col_2 在 groupby 和 [=17 之后=] 并以 dataframe 格式

存储在变量 a

Python代码

import pandas as pd
import numpy as np

df = pd.DataFrame(dict(Gender=['M', 'F', 'M', 'F',
                           'F', 'M', 'M', np.nan],
                   State=['NY','IL', 'NY', 'CA',
                          'IL', 'CA', 'CA', 'IL'],
                   col_1=[10,20,30,np.nan,40,50,60,70],
                   col_2=[1,6,2,4,6,9,np.nan,3]))

d = df.groupby(['Gender','State']).sum()
d.loc['F']

执行结果

       col_1    col_2
State       
CA     0.0      4.0
IL     60.0     12.0

预期结果 （数据帧格式）

  a = 
           col_1    col_2
   
           0.0      4.0
           60.0     12.0

Answer 1

获取grupby数据后可以重新设置索引d.

print(d.loc['F'].reset_index(drop=True))

   col_1  col_2
0    0.0    4.0
1   60.0   12.0

在 groupby 和 loc 之后存储值

store values after groupby and loc

python

dataframe

pandas

pandas-groupby

pandas-loc