Groupby In [=10th=] Dataframe with Multi Indexing
Groupby In Pandas Dataframe with MultiIndexing
PS:列为name
的GroupBy
我已经尝试使用 MultiIndexing 创建 DataFrame:
import pandas as pd
df = [ [ 'las_00', '6', '3', '3', 'a', '1.03', '1.11', '1.11' ],
[ 'las_01', '6', '3', '3', 'b', '1.03', '1.11', '1.11' ],
[ 'las_02', '6', '3', '3', 'c', '1.03', '1.11', '1.11' ],
[ 'las_03', '6', '3', '3', 'a', '1.03', '1.11', '1.11' ],
[ 'las_03', '6', '3', '3', 'b', '1.03', '1.11', '1.11' ]
]
new_df = pd.DataFrame( df , columns = [ 'name, name', 'transactionCount, totalCount', 'transactionCount, passCount', 'transactionCount, failCount', 'status, failPerc', 'status, mean',
'status, perc90', 'status, max' ] )
a = new_df.columns.str.split( ', ', expand=True ).values
new_df.columns = pd.MultiIndex.from_tuples( [ ( ' ', x[ 0 ] ) if pd.isnull( x[ 1 ] ) else x for x in a])
结果数据帧是:
name transactionCount status
name totalCount passCount failCount failPerc mean perc90 max
0 las_00 6 3 3 a 1.03 1.11 1.11
1 las_01 6 3 3 b 1.03 1.11 1.11
2 las_02 6 3 3 c 1.03 1.11 1.11
3 las_03 6 3 3 a 1.03 1.11 1.11
4 las_03 6 3 3 b 1.03 1.11 1.11
现在我想使用名称为 的 GroupBy 我尝试使用 level
但不知道如何使用列 name
。谁能帮忙解决这个问题!
谢谢
试试这个:
new_df.groupby(('name','name'))
此外,您可以按数据框列切片进行分组:
new_df.groupby(new_df.columns[0])
PS:列为name
我已经尝试使用 MultiIndexing 创建 DataFrame:
import pandas as pd
df = [ [ 'las_00', '6', '3', '3', 'a', '1.03', '1.11', '1.11' ],
[ 'las_01', '6', '3', '3', 'b', '1.03', '1.11', '1.11' ],
[ 'las_02', '6', '3', '3', 'c', '1.03', '1.11', '1.11' ],
[ 'las_03', '6', '3', '3', 'a', '1.03', '1.11', '1.11' ],
[ 'las_03', '6', '3', '3', 'b', '1.03', '1.11', '1.11' ]
]
new_df = pd.DataFrame( df , columns = [ 'name, name', 'transactionCount, totalCount', 'transactionCount, passCount', 'transactionCount, failCount', 'status, failPerc', 'status, mean',
'status, perc90', 'status, max' ] )
a = new_df.columns.str.split( ', ', expand=True ).values
new_df.columns = pd.MultiIndex.from_tuples( [ ( ' ', x[ 0 ] ) if pd.isnull( x[ 1 ] ) else x for x in a])
结果数据帧是:
name transactionCount status
name totalCount passCount failCount failPerc mean perc90 max
0 las_00 6 3 3 a 1.03 1.11 1.11
1 las_01 6 3 3 b 1.03 1.11 1.11
2 las_02 6 3 3 c 1.03 1.11 1.11
3 las_03 6 3 3 a 1.03 1.11 1.11
4 las_03 6 3 3 b 1.03 1.11 1.11
现在我想使用名称为 的 GroupBy 我尝试使用 level
但不知道如何使用列 name
。谁能帮忙解决这个问题!
谢谢
试试这个:
new_df.groupby(('name','name'))
此外,您可以按数据框列切片进行分组:
new_df.groupby(new_df.columns[0])