如何link 10-fcv weka预测结果回原评论进行文本分类

How to link 10-fcv weka predicted result back to original comment for text classification

我是否可以在使用 10 折交叉验证 class化文本后将我的预测结果返回到原始评论?

来自 class non-sarc 和 sarc 的 2000 条评论的结果:

inst#,actual,predicted,error,prediction
1,2:non-sarc,2:non-sarc,,1
2,2:non-sarc,1:sarc,+,1
3,2:non-sarc,2:non-sarc,,1
4,2:non-sarc,2:non-sarc,,1
5,2:non-sarc,2:non-sarc,,1
.
.
101,1:sarc,1:sarc,,1
102,1:sarc,2:non-sarc,+,1
103,1:sarc,1:sarc,,1
104,1:sarc,1:sarc,,1
105,1:sarc,1:sarc,,1
.
.

看来 weka 已将我的评论重新安排到 class split before hold out for training and testing。我如何才能将此结果返回到不按顺序排列的原始评论(不像 10-fcv 之后)?我已经尝试将评论重新排列为非 sarc 和 sarc 的 class 序列,但我混淆了哪个 test/training 首先,是先进行第一次折叠测试,还是首先进行最后一次折叠测试,或者还有其他吗?

提前致谢。

由于没有人回答我的问题,我自己想了想,希望这对遇到同样问题的其他人有所帮助。

  1. 预处理中;过滤器>无监督; AddID到属性中,到第一个位置。这将为每个原始标签提供 ID [IDIndex: First]

  1. 分类中;选择分类器。 test选项设置10-fcv,more选项设置attributes为1,选择for link,输出格式预测结果[attributes: 1]

  1. Start/Run预测。输出显示实际标签和预测。错误是用+标记,ID指的是预测前的原始标签。

祝一切顺利!