处理 scikit-learn MLPClassifier 的分类 class 标签

Handle categorical class labels for scikit-learn MLPClassifier

我有一个用于 class 化目的的手写数据集,其中 classes 来自 a-z。如果我想使用 MLPClassifier,我认为我不能直接使用这种分类 classes,因为 scikit-learn 中的 MLP 实现仅处理数字 classes。因此,在这里应该采取什么适当的行动?将这些 classes 转换为 1-28 编号,是否有意义?如果不是,scikit-learn 是否为 class 标签提供了特殊的编码机制来处理这种情况(我想这里不支持单热编码)?

谢谢

您可能需要预处理数据,因为 scikit-learn 仅处理数值。在这种情况下,我想预测交易的货币。货币以 ISO 代码表示,因此使用 LabelEncoder 将其转换为数字类别(即:1、2、3 ...):

#Import the object LabelEncoder
from sklearn.preprocessing import LabelEncoder

#defining class column
my_encoder = LabelEncoder()
my_class_currency = np.array(my_encoder.fit_transform(my_data['currency'])).reshape(-1,1)
#Create a "diccionary" to translate the categories into the actual values once you have the output
my_class_decoder = list(np.unique(my_data['currency']))