Sklearn Random Forest 不同标签编码的不同精度值

Sklearn Random Forrest different accuracy values for different label encodings

我正在使用 sklearn Random Forrest 来训练我的模型。使用相同的模型输入特征,我尝试首先使用 label_binarize 传递目标标签以创建目标标签的热编码,然后我尝试使用 label_encoder 对我的目标标签进行编码。在这两种情况下,我得到不同的准确度分数。发生这种情况是否有特定原因,因为我只是在不更改任何输入功能的情况下使用不同的方法对标签进行编码。

不是label的问题,而是Random Forest的随机性

尝试修复 random_state 以避免这种情况。

https://datascience.stackexchange.com/questions/74364/random-forrest-sklearn-gives-different-accuracy-for-different-target-label-encod

基本上,当您将目标标签编码为一个热编码时,sklearn 将其视为多标签问题,而标签编码器给出一维数组,其中 sklearn 将其视为多类问题。

https://scikit-learn.org/stable/modules/multiclass.html