如何对多类数据集进行二分类?
How to do binary classification on multiclass dataset?
我想对多类数据集(由来自多个科学文章文件的标记句子组成)进行两种类型的分类。我想做的与此类似 https://www.cl.cam.ac.uk/~sht25/papers/aaai98.pdf 。所以第一个是二元分类,从名为“其他”的标签中去除句子。剩下的将用于第二个分类,即多类分类。
目前我停留在 'how do I do binary classification on multiclass dataset?'。我考虑过进行 one vs rest (ovr) 分类,但从我看到的示例来看,内置 ovr 将为所有 类 创建模型并从那里进行 ovr。与此同时,我只想为一个标签做 ovr,即“其他”与所有其他标签。请帮忙。
只需创建一个新的标签列,如果标签是“其他”,则(对于每一行)分配 1,否则分配 0。然后使用新创建的标签列进行二元分类。我希望我理解正确你的问题?...
我想对多类数据集(由来自多个科学文章文件的标记句子组成)进行两种类型的分类。我想做的与此类似 https://www.cl.cam.ac.uk/~sht25/papers/aaai98.pdf 。所以第一个是二元分类,从名为“其他”的标签中去除句子。剩下的将用于第二个分类,即多类分类。
目前我停留在 'how do I do binary classification on multiclass dataset?'。我考虑过进行 one vs rest (ovr) 分类,但从我看到的示例来看,内置 ovr 将为所有 类 创建模型并从那里进行 ovr。与此同时,我只想为一个标签做 ovr,即“其他”与所有其他标签。请帮忙。
只需创建一个新的标签列,如果标签是“其他”,则(对于每一行)分配 1,否则分配 0。然后使用新创建的标签列进行二元分类。我希望我理解正确你的问题?...