在 groupby 和 loc 之后存储值
store values after groupby and loc
使用 df
到 select 两列 col_1
和 col_2
在 groupby
和 [=17 之后=] 并以 dataframe 格式
存储在变量 a
Python代码
import pandas as pd
import numpy as np
df = pd.DataFrame(dict(Gender=['M', 'F', 'M', 'F',
'F', 'M', 'M', np.nan],
State=['NY','IL', 'NY', 'CA',
'IL', 'CA', 'CA', 'IL'],
col_1=[10,20,30,np.nan,40,50,60,70],
col_2=[1,6,2,4,6,9,np.nan,3]))
d = df.groupby(['Gender','State']).sum()
d.loc['F']
执行结果
col_1 col_2
State
CA 0.0 4.0
IL 60.0 12.0
预期结果 (数据帧格式)
a =
col_1 col_2
0.0 4.0
60.0 12.0
获取grupby数据后可以重新设置索引d
.
print(d.loc['F'].reset_index(drop=True))
col_1 col_2
0 0.0 4.0
1 60.0 12.0
使用 df
到 select 两列 col_1
和 col_2
在 groupby
和 [=17 之后=] 并以 dataframe 格式
a
Python代码
import pandas as pd
import numpy as np
df = pd.DataFrame(dict(Gender=['M', 'F', 'M', 'F',
'F', 'M', 'M', np.nan],
State=['NY','IL', 'NY', 'CA',
'IL', 'CA', 'CA', 'IL'],
col_1=[10,20,30,np.nan,40,50,60,70],
col_2=[1,6,2,4,6,9,np.nan,3]))
d = df.groupby(['Gender','State']).sum()
d.loc['F']
执行结果
col_1 col_2
State
CA 0.0 4.0
IL 60.0 12.0
预期结果 (数据帧格式)
a =
col_1 col_2
0.0 4.0
60.0 12.0
获取grupby数据后可以重新设置索引d
.
print(d.loc['F'].reset_index(drop=True))
col_1 col_2
0 0.0 4.0
1 60.0 12.0