如何使用查找减少分类特征的条件性 table

How to reduce conditionality of a categorical feature using a lookup table

我是一个数据框 (df1),其一个分类列是

df1=pd.Dataframe({'COL1': ['AA','AB','BC','AC','BA','BB','BB','CA','CB','CD','CE']})

我有另一个数据框 (df2),它有两列

df2=pd.Dataframe({'Category':['AA','AB','AC','BA','BB','BC','CA','CB','CC','CD','CE','CF'],'general_mapping':['A','A','A','B','B','B','C','C','C','C','C','C']})

我需要使用 df2 修改 df1,最终看起来像:

df1->> ({'COL1': ['A','A','B','A','B','B','B','C','C','C','C']})

您可以使用 pd.Series.map after setting Category as index using df.set_index.

df1['COL1'] = df1['COL1'].map(df2.set_index('Category')['general_mapping'])
df1
   COL1
0     A
1     A
2     B
3     A
4     B
5     B
6     B
7     C
8     C
9     C
10    C