一个热编码一个 2 分类变量

One Hot Encoding a 2 categorical variable

对于两个类别的变量,是否需要进行One Hot Encoded?在我的数据集中,我有一个 1 或 0 的二进制变量。我是否需要在管道中为我的模型转换该变量,还是保持原样?

variable = np.array([0,0,0,1,0,1,0]).reshape(-1,1)
ohc = OneHotEncoder()
ohc.fit(variable)

如果你的变量已经是二进制的(只有两个 类:0 和 1),你可以说这个变量已经是 One Hot Encoded,所以你不需要 OneHotEncoder再次使用 Sklearn 函数。

此外,一般来说,如果二进制变量是分类变量,则必须使用 LabelEncoder 将其转换为数值。无论如何,在你的例子中,你的变量已经是数字了。