进行 n-gram 分类时 Rapidminer 中的多项式错误

Polynominal error in Rapidminer when doing n-gram classification

我正在尝试使用 n-gram 对文本中的不同概念进行分类。我的数据通常有六列:

  1. 需要分类的词
  2. 分类
  3. 1)左边第一个字
  4. 1)左边第二个字
  5. 1)右边第一个字
  6. 1)右边第二个字

当我尝试在 Rapidminer 中使用 SVM 时,出现无法处理多项式值的错误。我知道这是可以做到的,因为我在不同的论文中读过它。我将第二列设置为'label',并尝试将其余列设置为'text'或'real',但似乎没有效果。我做错了什么?

一种方法是创建名称等于单词的属性,值等于与感兴趣单词的距离。当然,所有可能的单词都需要表示为属性,因此输入数据会很大。

您必须使用 Support Vector Machine (LibSVM) 运算符。 与仅支持两个 class 问题的 classic SVM 相比,LibSVM 实现(http://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf)支持多class class化和回归.