如何处理sklearn中不是整数的数据

How to deal with data that is not ints in sklearn

我对 sklearn 和 pandas 很陌生,想知道如何处理非 int 值。 我已经完成了示例,其中数据只是整数并且它有效但现在我正在使用字符串并且它不起作用我已经尝试过 astype 但它没有帮助。

数据在 csv 中,看起来是这样的:

|value| type|
|a    |    g|
|b    |    g|
|a    |    g|
|d    |    g|
|c    |    k|
|f    |    g|

值是目标,但我不知道如何传递它以使用此数据来执行 X 和 Y,因此我可以使用 有点合身。

您不能使用分类值(对象、字符串等)。必须使用编码器将分类变量转换为数值变量 (sklearn.preprocessing.LabelEncoder) 例如 a --> 0 / b--> 1 / d--> 2 / c --> 3 和 f --> 4 如果您想自定义转换分类 --> 数值,您应该手动进行转换。