Python 中的多类文本分类
Multiclass Text Classification in Python
我正在尝试按照 here 的说明创建多类文本分类器。但是,我的代码在行中断:
NB_pipeline.fit(X_train, train[category])
下面是我得到的错误:
File "pandas\hashtable.pyx", line 683, in pandas.hashtable.PyObjectHashTable.get_item (pandas\hashtable.c:12322)
我试图找出 train[category]
returns 的内容,但我遇到了同样的错误。
1) X_train
是一个 dataframe
,只有一栏并且包含客户反馈。
2) train
是一个有两列的 dataframe
;第一列包含客户评论(与 X_train
相同),第二列包含 5 个类别之一 (Systems Error, Proactive Communication, Staff Behaviour, Website Functionalities, Others
)。
3) category
是上述类别之一。
下面是示例火车 dataframe
:
Index Feedback Category
0 While making payment got system error. System error
Staff behaviour was good at hotel
1 While making payment got system error. Staff Behaviour
Staff behaviour was good at hotel
这是最容易被忽视的问题之一。
出现此错误的原因是"column" 脚本正在查找的数据帧中不可用。您拥有的所有 5 个类别都应该是输入数据框中的列,如果其中一个类别适用于 feedback/comment,行将取 1/0。理想情况下,您的输入数据框应如下所示。
Index Feedback System error Staff Behaviour
0 While making payment got system error. 1 1
Staff behaviour was good at hotel
1 While making payment got system error. 1 0
2 Staff behaviour was good at hotel 0 1
我使用了相同的注释来展示输入数据框应该是什么样子。
我正在尝试按照 here 的说明创建多类文本分类器。但是,我的代码在行中断:
NB_pipeline.fit(X_train, train[category])
下面是我得到的错误:
File "pandas\hashtable.pyx", line 683, in pandas.hashtable.PyObjectHashTable.get_item (pandas\hashtable.c:12322)
我试图找出 train[category]
returns 的内容,但我遇到了同样的错误。
1) X_train
是一个 dataframe
,只有一栏并且包含客户反馈。
2) train
是一个有两列的 dataframe
;第一列包含客户评论(与 X_train
相同),第二列包含 5 个类别之一 (Systems Error, Proactive Communication, Staff Behaviour, Website Functionalities, Others
)。
3) category
是上述类别之一。
下面是示例火车 dataframe
:
Index Feedback Category
0 While making payment got system error. System error
Staff behaviour was good at hotel
1 While making payment got system error. Staff Behaviour
Staff behaviour was good at hotel
这是最容易被忽视的问题之一。
出现此错误的原因是"column" 脚本正在查找的数据帧中不可用。您拥有的所有 5 个类别都应该是输入数据框中的列,如果其中一个类别适用于 feedback/comment,行将取 1/0。理想情况下,您的输入数据框应如下所示。
Index Feedback System error Staff Behaviour
0 While making payment got system error. 1 1
Staff behaviour was good at hotel
1 While making payment got system error. 1 0
2 Staff behaviour was good at hotel 0 1
我使用了相同的注释来展示输入数据框应该是什么样子。