进行 n-gram 分类时 Rapidminer 中的多项式错误
Polynominal error in Rapidminer when doing n-gram classification
我正在尝试使用 n-gram 对文本中的不同概念进行分类。我的数据通常有六列:
- 需要分类的词
- 分类
- 1)左边第一个字
- 1)左边第二个字
- 1)右边第一个字
- 1)右边第二个字
当我尝试在 Rapidminer 中使用 SVM 时,出现无法处理多项式值的错误。我知道这是可以做到的,因为我在不同的论文中读过它。我将第二列设置为'label',并尝试将其余列设置为'text'或'real',但似乎没有效果。我做错了什么?
一种方法是创建名称等于单词的属性,值等于与感兴趣单词的距离。当然,所有可能的单词都需要表示为属性,因此输入数据会很大。
您必须使用 Support Vector Machine (LibSVM)
运算符。
与仅支持两个 class 问题的 classic SVM 相比,LibSVM 实现(http://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf)支持多class class化和回归.
我正在尝试使用 n-gram 对文本中的不同概念进行分类。我的数据通常有六列:
- 需要分类的词
- 分类
- 1)左边第一个字
- 1)左边第二个字
- 1)右边第一个字
- 1)右边第二个字
当我尝试在 Rapidminer 中使用 SVM 时,出现无法处理多项式值的错误。我知道这是可以做到的,因为我在不同的论文中读过它。我将第二列设置为'label',并尝试将其余列设置为'text'或'real',但似乎没有效果。我做错了什么?
一种方法是创建名称等于单词的属性,值等于与感兴趣单词的距离。当然,所有可能的单词都需要表示为属性,因此输入数据会很大。
您必须使用 Support Vector Machine (LibSVM)
运算符。
与仅支持两个 class 问题的 classic SVM 相比,LibSVM 实现(http://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf)支持多class class化和回归.