如何将我的模型应用到 WEKA 中的新数据集?
How do I apply my model to a new dataset in WEKA?
我根据提供给我的数据集创建了一个新的预测模型。它根据许多数值属性预测标称(二进制)class 属性 (positive/negative)。
现在我被要求使用这个预测模型来预测新数据集的 classes。此数据集具有所有相同的属性,但 class 列除外,该列尚不存在。如何将我的模型应用于这些新数据?我尝试向我的新数据集添加一个空的 class 列,然后执行以下操作:
- 只需在 WEKA 的资源管理器中加载新数据集并加载模型。它告诉我没有训练数据。
- 在 WEKA 的资源管理器中打开我的训练集,然后打开我的训练模型,然后选择我的新数据作为 'supplied test set'。它运行但不输出任何预测。
我应该注意到,在对训练数据进行交叉验证测试时,该模型运行良好。它也适用于我多年前分离出来供 test/eval 使用的训练数据子集。我认为我添加新 class 列的方式可能有问题,也许吧?
为了进行预测,Weka 要求两个数据集(训练数据集和用于进行预测的数据集)具有完全相同的结构,包括标签的顺序。这也意味着,您需要有一个带有正确标签的 class 属性。就 class 属性的值而言,只需使用缺失值(用问号表示)。
有关如何进行预测的详细信息,请参阅 Weka wiki 上的常见问题 How do i make predictions with a trained model?。
我根据提供给我的数据集创建了一个新的预测模型。它根据许多数值属性预测标称(二进制)class 属性 (positive/negative)。
现在我被要求使用这个预测模型来预测新数据集的 classes。此数据集具有所有相同的属性,但 class 列除外,该列尚不存在。如何将我的模型应用于这些新数据?我尝试向我的新数据集添加一个空的 class 列,然后执行以下操作:
- 只需在 WEKA 的资源管理器中加载新数据集并加载模型。它告诉我没有训练数据。
- 在 WEKA 的资源管理器中打开我的训练集,然后打开我的训练模型,然后选择我的新数据作为 'supplied test set'。它运行但不输出任何预测。
我应该注意到,在对训练数据进行交叉验证测试时,该模型运行良好。它也适用于我多年前分离出来供 test/eval 使用的训练数据子集。我认为我添加新 class 列的方式可能有问题,也许吧?
为了进行预测,Weka 要求两个数据集(训练数据集和用于进行预测的数据集)具有完全相同的结构,包括标签的顺序。这也意味着,您需要有一个带有正确标签的 class 属性。就 class 属性的值而言,只需使用缺失值(用问号表示)。
有关如何进行预测的详细信息,请参阅 Weka wiki 上的常见问题 How do i make predictions with a trained model?。