sklearn:特征提取类型错误
Sklearn: feature extraction type error
作为编程初学者,我在使用 Scikit learn 进行机器学习实验时遇到了一些文本分类问题。我使用 10 折交叉验证,因此训练和测试数据没有划分。
我的问题始于特征提取模块。这是有错误的代码:
vec = DictVectorizer()
X = vec.fit_transform(instances).toarray()
最后一行报错如下:
TypeError: float() argument must be a string or a number, not 'dict'
Instances 是一个特征向量字典列表,每个文档一个字典。 instances列表开头的例子(可以看到第一个文档的字典的一部分)。
一些特征是嵌套在特征向量字典中的字典。我不知道如何让它不嵌套,但也许这就是问题所在?
是的,问题出在您的嵌套字典特征向量上。拆分它们,使它们成为独立的特征。
作为编程初学者,我在使用 Scikit learn 进行机器学习实验时遇到了一些文本分类问题。我使用 10 折交叉验证,因此训练和测试数据没有划分。
我的问题始于特征提取模块。这是有错误的代码:
vec = DictVectorizer()
X = vec.fit_transform(instances).toarray()
最后一行报错如下:
TypeError: float() argument must be a string or a number, not 'dict'
Instances 是一个特征向量字典列表,每个文档一个字典。 instances列表开头的例子(可以看到第一个文档的字典的一部分)。
是的,问题出在您的嵌套字典特征向量上。拆分它们,使它们成为独立的特征。