一个热编码器用于多个单词的分类变量

one hot encoder for the categorical variables of more one word

我有一个如下所示的数据集。我想为 'Item' 列的逻辑回归做一个热编码。 'Item' 列中有 313 个不同的项目,我遇到了以下错误。请问可以帮忙解决吗?

enter image description here 这是代码:

 from sklearn.compose import ColumnTransformer
    from sklearn.preprocessing import OneHotEncoder
    ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [0])], 
    remainder='passthrough')
    X = np.array(ct.fit_transform(X))**

array(<1126x316 类型为''的稀疏矩阵 以压缩稀疏行格式存储了 4493 个元素>, dtype=object)

使用此代码,其中 df 是数据框的名称

import pandas as pd
df = pd.get_dummies(data = df, columns = ['Item'])