测试示例集属性应等于训练示例集 Rapidminer SVM 的 OR 超集
Test example set attributes should be equal to OR Superset of Training example set Rapidminer SVM
我是 Rapid Miner 的新手,在其中使用 SVM Linear。我的模型如下:
我制作了训练示例集,其中包含 3552 个示例和 2 个属性,我正在进行名义到数字的转换,通过SVM 线性模型,然后在应用模型时连接模型输出。这可以。
在测试示例集中,我有 735 个具有 2 个属性的示例,并进行名义到数字的转换,然后将此转换后的示例集应用到应用模型。在这个阶段,当我 运行 这个过程时,我得到一个错误,它说:
我对此进行了很多搜索,但没有找到正确的方向。我会感谢你的帮助。
Nominal to Numeric
运算符将创建新属性,其名称将派生自输入属性的值。当 dummy encoding
用于 coding type
参数时会发生这种情况。如果与训练数据相比,测试数据包含不同的值,则生成的属性将不同。
要确认这是问题所在,请在 Nominal to Numeric
运算符后设置断点并检查每个示例集的属性。
您可以通过将参数设置为 unique integers
来更改运算符的工作方式,但这可能不适合您要解决的问题。
解决它的一种可能方法是合并两个数据集,然后再次拆分它们。这具有为每个名义属性创建允许级别的效果,即使数据可能没有值的示例。然后每个拆分都可以与 Nominal to Numeric
运算符一起使用,它应该创建所有必需的属性。
我是 Rapid Miner 的新手,在其中使用 SVM Linear。我的模型如下:
我制作了训练示例集,其中包含 3552 个示例和 2 个属性,我正在进行名义到数字的转换,通过SVM 线性模型,然后在应用模型时连接模型输出。这可以。
在测试示例集中,我有 735 个具有 2 个属性的示例,并进行名义到数字的转换,然后将此转换后的示例集应用到应用模型。在这个阶段,当我 运行 这个过程时,我得到一个错误,它说:
我对此进行了很多搜索,但没有找到正确的方向。我会感谢你的帮助。
Nominal to Numeric
运算符将创建新属性,其名称将派生自输入属性的值。当 dummy encoding
用于 coding type
参数时会发生这种情况。如果与训练数据相比,测试数据包含不同的值,则生成的属性将不同。
要确认这是问题所在,请在 Nominal to Numeric
运算符后设置断点并检查每个示例集的属性。
您可以通过将参数设置为 unique integers
来更改运算符的工作方式,但这可能不适合您要解决的问题。
解决它的一种可能方法是合并两个数据集,然后再次拆分它们。这具有为每个名义属性创建允许级别的效果,即使数据可能没有值的示例。然后每个拆分都可以与 Nominal to Numeric
运算符一起使用,它应该创建所有必需的属性。