RapidMiner:能够根据用户设置的支持阈值进行分类吗?

RapidMiner: Ability to classify based off user set support threshold?

我已经建立了一个小文本分析模型,可以将小文本文件分类为好、坏或中性。我使用支持向量机作为我的分类器。但是,我想知道是否可以将所有三个分类为好或坏,而不是分类,但如果对该文本文件的支持低于 .7 或某个用户​​指定的阈值,它将将该文本文件分类为中性。我知道这并不是最好的方法,我只是想看看如果我采用不同的方法会发生什么。

运算符 Drop Uncertain Predictions 可能就是您想要的。

将模型应用于某些测试数据后,生成的示例集将具有预测和两个新属性,分别称为 confidence(Good)confidence(Bad)。这些置信度介于 0 和 1 之间,对于两个 class 案例,示例集中的每个示例的置信度总和为 1。最高置信度决定预测值。

Drop Uncertain Predictions 运算符需要一个 min confidence 参数,如果它找到的最大置信度低于此值(您也可以对不同的 class 更高级调查的值)。

然后您可以使用 Replace Missing Values 运算符将所有缺失的预测更改为您选择的文本值。