是仅文本的多标签分类

is multi-label clasification for text only

我正在研究一个数字数据集,显然它是一个多变量输出回归。我想知道您是否可以在数字数据集中进行多标签分类,或者它仅适用于基于文本的分类。

例如:Whosebug 将每个 text/code 分类为多个标签,例如 python,flask, python2.7 ... 但是可以用数字来完成类似的事情。抱歉,我知道这是一个菜鸟问题,但我想知道答案。提前致谢。

当然可以用数字来完成。毕竟,文本本身被转换为数字以进行 class 化。但是你不应该为此使用回归。这显然是 class化的情况。

一个常规的 classifier(例如神经网络)通常有多个输出,每个 class 一个。每个输出 returns 输入向量属于特定 class.

的概率

在标准的class化中,你以最大的概率将它分配给class。在你的情况下,只需将它分配给 p > 0.5 的所有 classes(假设输出在 [0, 1].

关于你的问题是多重回归还是多重class化问题,你不能仅仅通过查看输入就知道。您根据要查找的内容来决定。如果您尝试在连续范围内查找数值(例如,预测给定产品的价格和销售数量),请选择回归。如果您有许多输入具有或不具有的属性,请选择 classification。