SVM 在 Rapidminer 中的结果比在 knime 中的结果差得多
SVM results in Rapidminer much worse than in knime
我正在比较使用 knime 的项目的各种分类算法。我对支持向量机 (LibSVM) 的结果感到非常满意。
然后我想尝试分层分类并安装了 knime 的 Rapidminer 插件。为了让事情正常进行,我首先测试了没有层次结构的 SVM 实现。
比较 knime LibSVM 实现和 rapidminer LibSVM 实现的结果,我注意到 rapidminer 实现产生了更差的结果。
knime 实现实际上产生了大约 2.4% 的错误率,而 rapidminer 产生了大约 2.4% 的错误率。 61%。
这是为什么?我做错了什么吗?
对于这两种实现,我都使用具有线性内核、1.0 成本、0.001 epsilon 和 80mb 缓存的 C-SVC SVM。
这些文档是维基百科文章文本,经过预处理、转换为二进制文档向量并标有某种类型。
希望你能帮帮我。
在这种情况下,您不需要包含 Row ID
(Row ID
选项卡,如果它是 [=13=,请单击它使按钮显示 Do not use
] 并且文本字段未被禁用),并且您不应对它们执行 Nominal to...
转换。之后,您应该在两种情况下得到相似的结果。
我正在比较使用 knime 的项目的各种分类算法。我对支持向量机 (LibSVM) 的结果感到非常满意。 然后我想尝试分层分类并安装了 knime 的 Rapidminer 插件。为了让事情正常进行,我首先测试了没有层次结构的 SVM 实现。
比较 knime LibSVM 实现和 rapidminer LibSVM 实现的结果,我注意到 rapidminer 实现产生了更差的结果。 knime 实现实际上产生了大约 2.4% 的错误率,而 rapidminer 产生了大约 2.4% 的错误率。 61%。 这是为什么?我做错了什么吗?
对于这两种实现,我都使用具有线性内核、1.0 成本、0.001 epsilon 和 80mb 缓存的 C-SVC SVM。
这些文档是维基百科文章文本,经过预处理、转换为二进制文档向量并标有某种类型。
希望你能帮帮我。
在这种情况下,您不需要包含 Row ID
(Row ID
选项卡,如果它是 [=13=,请单击它使按钮显示 Do not use
] 并且文本字段未被禁用),并且您不应对它们执行 Nominal to...
转换。之后,您应该在两种情况下得到相似的结果。