如何将带有字符串的列替换为带有整数的列?
How to replace a column with strings into a column with integers?
我正在尝试预测一个数据集,该数据集有一列包含不同的字符串。例如,有3个品牌,'A','B','C',我想用数字(例如0、1和2)替换它们。
如果只有 2 个品牌,我知道如何使用 pd.eq
、
我曾尝试使用 set
,但我想知道是否有更简单的方法来做到这一点,因为我将不得不用具有 5 个以上不同字符串的列替换它,这会很烦人。
您可以通过选择符合这些条件的记录来替换它们,假设您的数据在 df
中并且感兴趣的列是 'Brand'
:
replacement = { 'A': 0, 'B': 1, 'C': 2 }
for key, value in replacement.items():
df.loc[df['Brand'] == key, 'Brand'] = value
df['Brand'].map({'A': 0, 'B':1,'C': 2})
我正在尝试预测一个数据集,该数据集有一列包含不同的字符串。例如,有3个品牌,'A','B','C',我想用数字(例如0、1和2)替换它们。
如果只有 2 个品牌,我知道如何使用 pd.eq
、
我曾尝试使用 set
,但我想知道是否有更简单的方法来做到这一点,因为我将不得不用具有 5 个以上不同字符串的列替换它,这会很烦人。
您可以通过选择符合这些条件的记录来替换它们,假设您的数据在 df
中并且感兴趣的列是 'Brand'
:
replacement = { 'A': 0, 'B': 1, 'C': 2 }
for key, value in replacement.items():
df.loc[df['Brand'] == key, 'Brand'] = value
df['Brand'].map({'A': 0, 'B':1,'C': 2})