值:使用 Sklearn 功能相关性时错误无法将字符串转换为浮点数

Value: Error Could not Convert string to float while using Sklearn Feature Relevance

您好,我已经训练和测试了数据。我正在尝试使用 sklearn 的特征相关性 Seelct K Best 来选择相关特征并在之后绘制条形图。但是我得到这个错误:

ValueError: could not convert string to float: B

但我开始认为我的数据集中确实有一列看起来像这样,这可能是问题所在:

CancellationCode:
A
B
C
D

如果此列导致问题,我该如何解决此错误 下面是我的代码:

import numpy as np
from sklearn.feature_selection import SelectKBest, f_classif
import matplotlib.pyplot as plt

selector = SelectKBest(f_classif, k=13)
selector.fit(X_train, y_train)

scores_select = selector.pvalues_
print scores_select


# Plotting the bar Graph to visually see the weight of each feature
plt.bar(range(len(scores_select)), scores_select, align='center')
plt.xticks(range(len(features_columns)), features_columns, rotation='vertical')
plt.show()

您需要将分类变量转换为虚拟变量。

 df = pd.get_dummies(df)