一个热编码器用于多个单词的分类变量
one hot encoder for the categorical variables of more one word
我有一个如下所示的数据集。我想为 'Item' 列的逻辑回归做一个热编码。 'Item' 列中有 313 个不同的项目,我遇到了以下错误。请问可以帮忙解决吗?
enter image description here
这是代码:
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [0])],
remainder='passthrough')
X = np.array(ct.fit_transform(X))**
array(<1126x316 类型为''的稀疏矩阵
以压缩稀疏行格式存储了 4493 个元素>, dtype=object)
使用此代码,其中 df
是数据框的名称
import pandas as pd
df = pd.get_dummies(data = df, columns = ['Item'])
我有一个如下所示的数据集。我想为 'Item' 列的逻辑回归做一个热编码。 'Item' 列中有 313 个不同的项目,我遇到了以下错误。请问可以帮忙解决吗?
enter image description here 这是代码:
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [0])],
remainder='passthrough')
X = np.array(ct.fit_transform(X))**
array(<1126x316 类型为'
使用此代码,其中 df
是数据框的名称
import pandas as pd
df = pd.get_dummies(data = df, columns = ['Item'])