Scikit Learn:逻辑回归错误
Scikit Learn : Logistic Regression Error
我正在尝试使用 scikit learn 运行 对我的数据(6 个分类,1 个整数)进行逻辑回归。我正在关注 scikit 学习文档,但是在尝试拟合我的数据时,我收到以下值错误。有人可以帮忙吗
#Below are the variables of my data.
train_data.dtypes
OUTPUT
TripType category
VisitNumber category
Weekday category
Upc category
ScanCount int64
DepartmentDescription category
FinelineNumber category
dtype: object
X = train_data.loc[:, 'VisitNumber':'FinelineNumber']
Y = train_data.loc[:, 'TripType':'TripType']
logreg = linear_model.LogisticRegression()
logreg.fit(X, Y)
**ValueError: could not convert string to float: GROCERY DRY GOODS**
Scikit-learn 只能处理数字特征。有关如何处理您的案例的一些想法,请参阅 scikit-learn 文档中的 Encoding Categorical Features。
逻辑回归中不能直接使用类别名称作为特征。您需要将它们转换成一些编码向量(或虚拟变量)。如果您有 6 个类别,则需要使用 5 个虚拟变量。
您可以查看以下 sklearn 包中的编码分类特征部分 link:
http://scikit-learn.org/stable/modules/preprocessing.html
我正在尝试使用 scikit learn 运行 对我的数据(6 个分类,1 个整数)进行逻辑回归。我正在关注 scikit 学习文档,但是在尝试拟合我的数据时,我收到以下值错误。有人可以帮忙吗
#Below are the variables of my data.
train_data.dtypes
OUTPUT
TripType category
VisitNumber category
Weekday category
Upc category
ScanCount int64
DepartmentDescription category
FinelineNumber category
dtype: object
X = train_data.loc[:, 'VisitNumber':'FinelineNumber']
Y = train_data.loc[:, 'TripType':'TripType']
logreg = linear_model.LogisticRegression()
logreg.fit(X, Y)
**ValueError: could not convert string to float: GROCERY DRY GOODS**
Scikit-learn 只能处理数字特征。有关如何处理您的案例的一些想法,请参阅 scikit-learn 文档中的 Encoding Categorical Features。
逻辑回归中不能直接使用类别名称作为特征。您需要将它们转换成一些编码向量(或虚拟变量)。如果您有 6 个类别,则需要使用 5 个虚拟变量。
您可以查看以下 sklearn 包中的编码分类特征部分 link: http://scikit-learn.org/stable/modules/preprocessing.html