如何link 10-fcv weka预测结果回原评论进行文本分类

Question

我是否可以在使用 10 折交叉验证 class化文本后将我的预测结果返回到原始评论？

来自 class non-sarc 和 sarc 的 2000 条评论的结果：

inst#,actual,predicted,error,prediction
1,2:non-sarc,2:non-sarc,,1
2,2:non-sarc,1:sarc,+,1
3,2:non-sarc,2:non-sarc,,1
4,2:non-sarc,2:non-sarc,,1
5,2:non-sarc,2:non-sarc,,1
.
.
101,1:sarc,1:sarc,,1
102,1:sarc,2:non-sarc,+,1
103,1:sarc,1:sarc,,1
104,1:sarc,1:sarc,,1
105,1:sarc,1:sarc,,1
.
.

看来 weka 已将我的评论重新安排到 class split before hold out for training and testing。我如何才能将此结果返回到不按顺序排列的原始评论（不像 10-fcv 之后）？我已经尝试将评论重新排列为非 sarc 和 sarc 的 class 序列，但我混淆了哪个 test/training 首先，是先进行第一次折叠测试，还是首先进行最后一次折叠测试，或者还有其他吗？

提前致谢。

Answer 1

由于没有人回答我的问题，我自己想了想，希望这对遇到同样问题的其他人有所帮助。

预处理中；过滤器>无监督； AddID到属性中，到第一个位置。这将为每个原始标签提供 ID [IDIndex: First]

分类中；选择分类器。 test选项设置10-fcv，more选项设置attributes为1，选择for link，输出格式预测结果[attributes: 1]

Start/Run预测。输出显示实际标签和预测。错误是用+标记，ID指的是预测前的原始标签。

祝一切顺利！

如何link 10-fcv weka预测结果回原评论进行文本分类

How to link 10-fcv weka predicted result back to original comment for text classification

weka

text-classification

rweka