测试示例集属性应等于训练示例集 Rapidminer SVM 的 OR 超集

Test example set attributes should be equal to OR Superset of Training example set Rapidminer SVM

我是 Rapid Miner 的新手,在其中使用 SVM Linear。我的模型如下:


我制作了训练示例集,其中包含 3552 个示例和 2 个属性,我正在进行名义到数字的转换,通过SVM 线性模型,然后在应用模型时连接模型输出。这可以。

在测试示例集中,我有 735 个具有 2 个属性的示例,并进行名义到数字的转换,然后将此转换后的示例集应用到应用模型。在这个阶段,当我 运行 这个过程时,我得到一个错误,它说:

我对此进行了很多搜索,但没有找到正确的方向。我会感谢你的帮助。

Nominal to Numeric 运算符将创建新属性,其名称将派生自输入属性的值。当 dummy encoding 用于 coding type 参数时会发生这种情况。如果与训练数据相比,测试数据包含不同的值,则生成的属性将不同。

要确认这是问题所在,请在 Nominal to Numeric 运算符后设置断点并检查每个示例集的属性。

您可以通过将参数设置为 unique integers 来更改运算符的工作方式,但这可能不适合您要解决的问题。

解决它的一种可能方法是合并两个数据集,然后再次拆分它们。这具有为每个名义属性创建允许级别的效果,即使数据可能没有值的示例。然后每个拆分都可以与 Nominal to Numeric 运算符一起使用,它应该创建所有必需的属性。