LinearSVC 是否接收定性数据?

Does LinearSVC take in qualitative data?

我正在尝试使用 python、滑雪套件学习和 LinearSVC 方法来预测歌曲是否使用开放版本播放。

我的输入数据:

我已经将产品列编码为 1 和 0(如果打开则为 1,否则为 0)。

上下文等因素会对产品类型产生影响。我想知道是否需要将所有分类变量都设为数值以便 LinearSVC 处理它们。

一般来说,将分类特征转化为连续特征是一个次优的解决方案。

当使用支持向量机作为分类器(甚至逻辑回归)时,处理 0-1 编码的分类特征应该没有问题。如果您有无法转换为二进制的分类特征(例如,您的 "context" 列),我建议对数据进行单热编码(请先参见 here

如果某个特定功能的独特条目太多,则可能会出现问题。在那种情况下,one-hot-encoding 将产生与唯一条目一样多的特征,这可能在计算上很昂贵。