如何将带有字符串的列替换为带有整数的列?

How to replace a column with strings into a column with integers?

我正在尝试预测一个数据集,该数据集有一列包含不同的字符串。例如,有3个品牌,'A','B','C',我想用数字(例如0、1和2)替换它们。

如果只有 2 个品牌,我知道如何使用 pd.eq

我曾尝试使用 set,但我想知道是否有更简单的方法来做到这一点,因为我将不得不用具有 5 个以上不同字符串的列替换它,这会很烦人。

您可以通过选择符合这些条件的记录来替换它们,假设您的数据在 df 中并且感兴趣的列是 'Brand':

replacement = { 'A': 0, 'B': 1, 'C': 2 }
for key, value in replacement.items():
    df.loc[df['Brand'] == key, 'Brand'] = value
df['Brand'].map({'A': 0, 'B':1,'C': 2})