sklearn SVC 是否自动完成标签编码?

Is label encoding automatically done by sklearn SVC?

我正在使用 sklearn 训练支持向量机。一开始,我没有以任何形式对 class 标签进行编码,而是将它们保留为字符串(例如 ["A"、"B"、"C"])。产生的精度与我使用 LabelEncoder [0, 1, 2] 时的精度相当。那么 sklearn 是否在后台自动将字符串转换为 integers/one-hot-representations ?或者我在这里遗漏了什么?

只有当标签是自变量的一部分时,才需要对标签进行编码。因此,如果您有 SVM 用于确定因变量的标签列表,则必须使用 labelencoder 或 onehotencoder 或最适合您的数据集的方式对它们进行编码。 Scikit-learn 会自动对 strings 进行编码,因此您不必通过编写代码手动对它们进行编码。这意味着对于文本目标,Scikit-learn 无需您进行编码即可对其进行编码。希望这对您有所帮助!