pivot_table聚合后如何映射pandas结果?
How to map pandas results after pivot_table aggregation?
我有一些这样的测试数据:
import numpy as np
import pandas as pd
data = [[np.random.choice(['Tmax', 'Tmin']), np.random.choice(['USA', 'FRA', 'AUS']),
np.random.randint(1,4), np.random.choice(['Class A', 'Class B']),np.random.randint(4)] for i in range(1000)]
df = pd.DataFrame(data, columns=['temp', 'region', 'method', 'slice', 'pass'])
我使用 np.mean
函数对数据框进行了透视,如下所示:
pv = pd.pivot_table(df,
index=['temp', 'method'],
values=['pass'],
columns=['slice', 'region'],
aggfunc=(np.mean))
'pass'
变量的值是通过测试的平均值,以小数形式表示,例如 0.45、1.5 3.2...,但是我想使用以下函数映射这些结果
def results_mapper(v):
num_tests = np.round(v)
if num_tests < 2:
return 1
elif num_tests == 2:
return 2
else:
return 3
我尝试使用 pv.map(results_mapper)
或 map(results_mapper, pv)
映射结果,但没有成功。
样本数:
pv
输出数字可能类似于 0.5, 1.1, 1.49, 1.6, 1.9, 2.1, 2.9, 3.5
将映射到 1, 1, 1, 2, 2, 2, 3, 3
如何通过保持主元 table 格式不变来将映射函数应用于我的结果?
使用np.vectorize
func = np.vectorize(results_mapper)
pv.values[:,:] = func(pv.values)
输出
pass
slice Class A Class B
region AUS FRA USA AUS FRA USA
temp method
Tmax 1 1.0 1.0 2.0 2.0 2.0 1.0
2 1.0 2.0 1.0 1.0 1.0 1.0
3 1.0 2.0 2.0 2.0 2.0 2.0
Tmin 1 2.0 1.0 2.0 2.0 1.0 2.0
2 2.0 2.0 1.0 2.0 1.0 2.0
3 2.0 1.0 1.0 2.0 2.0 1.0
我有一些这样的测试数据:
import numpy as np
import pandas as pd
data = [[np.random.choice(['Tmax', 'Tmin']), np.random.choice(['USA', 'FRA', 'AUS']),
np.random.randint(1,4), np.random.choice(['Class A', 'Class B']),np.random.randint(4)] for i in range(1000)]
df = pd.DataFrame(data, columns=['temp', 'region', 'method', 'slice', 'pass'])
我使用 np.mean
函数对数据框进行了透视,如下所示:
pv = pd.pivot_table(df,
index=['temp', 'method'],
values=['pass'],
columns=['slice', 'region'],
aggfunc=(np.mean))
'pass'
变量的值是通过测试的平均值,以小数形式表示,例如 0.45、1.5 3.2...,但是我想使用以下函数映射这些结果
def results_mapper(v):
num_tests = np.round(v)
if num_tests < 2:
return 1
elif num_tests == 2:
return 2
else:
return 3
我尝试使用 pv.map(results_mapper)
或 map(results_mapper, pv)
映射结果,但没有成功。
样本数:
pv
输出数字可能类似于 0.5, 1.1, 1.49, 1.6, 1.9, 2.1, 2.9, 3.5
将映射到 1, 1, 1, 2, 2, 2, 3, 3
如何通过保持主元 table 格式不变来将映射函数应用于我的结果?
使用np.vectorize
func = np.vectorize(results_mapper)
pv.values[:,:] = func(pv.values)
输出
pass
slice Class A Class B
region AUS FRA USA AUS FRA USA
temp method
Tmax 1 1.0 1.0 2.0 2.0 2.0 1.0
2 1.0 2.0 1.0 1.0 1.0 1.0
3 1.0 2.0 2.0 2.0 2.0 2.0
Tmin 1 2.0 1.0 2.0 2.0 1.0 2.0
2 2.0 2.0 1.0 2.0 1.0 2.0
3 2.0 1.0 1.0 2.0 2.0 1.0