使用 One Hot Encoding 时的逻辑回归方程

Equation for Logistic regression while using One Hot Encoding

当特征是数字时,像这样:

假设sigmoid(transpose(theta).X))中的特征矩阵X将是:

然而,当我们在这里有 1 个特征时 - 颜色,可以是红色或蓝色或绿色,在做 One Hot Encoding 时每个都将是一个向量,如:[1 0 0] [0 1 0][0 0 1].

我无法弄清楚如何将这些 One Hot Encoding 向量合并到已经存在的特征矩阵中,然后在假设方程中使用它

是的,您应该从数据集中删除所有未编码的分类特征,对它们进行编码并从一个热编码中添加它们的编码值,当然您还必须将相应的权重添加到 theta 中。然后你可以在这个新数据集上拟合你的新模型