WEKA:在交叉验证时打印测试数据实例w.r.t原始数据的索引
WEKA: Print the Indexes of Test data instances w.r.t original data at the time of cross validation
我对交叉验证时weka选择的测试数据实例的索引有疑问。如何打印正在评估的测试数据实例的索引?
====================================
我选择了:
数据集:iris.arff
实例总数:150
分类器:J48
交叉验证:10 倍
我也做了输出预测"PlainText"
=============
在输出中 window 我可以看到这样的:-
inst#实际预测误差预测
1 3:Iris-弗吉尼亚 3:Iris-弗吉尼亚 0.976
2 3:Iris-弗吉尼亚 3:Iris-弗吉尼亚 0.976
3 3:Iris-弗吉尼亚 3:Iris-弗吉尼亚 0.976
4 3:Iris-弗吉尼亚 3:Iris-弗吉尼亚 0.976
5 3:Iris-弗吉尼亚 3:Iris-弗吉尼亚 0.976
6 1:Iris-setosa 1:Iris-setosa 1
7 1:Iris-setosa 1:Iris-setosa 1
.....
...
...
总共10个测试数据集。(每个15个实例)。
======================
由于 WEKA 使用启动交叉验证,测试数据集中的实例是随机选择的。
那么,如何打印测试数据的索引w.r.t原始文件中的数据?
即
inst#实际预测误差预测
1 3:Iris-弗吉尼亚 3:Iris-弗吉尼亚 0.976
这个结果是主要数据中的哪个实例(总共50个Iris-virginica)?
===============
经过大量搜索,我发现下面的 youtube 视频对解决上述问题很有帮助。
希望这对以后有相同疑问的访问者有所帮助。
Weka Tutorial 34: Generating Stratified Folds (Data Preprocessing)
我对交叉验证时weka选择的测试数据实例的索引有疑问。如何打印正在评估的测试数据实例的索引?
====================================
我选择了:
数据集:iris.arff
实例总数:150
分类器:J48
交叉验证:10 倍
我也做了输出预测"PlainText"
=============
在输出中 window 我可以看到这样的:-
inst#实际预测误差预测
1 3:Iris-弗吉尼亚 3:Iris-弗吉尼亚 0.976
2 3:Iris-弗吉尼亚 3:Iris-弗吉尼亚 0.976
3 3:Iris-弗吉尼亚 3:Iris-弗吉尼亚 0.976
4 3:Iris-弗吉尼亚 3:Iris-弗吉尼亚 0.976
5 3:Iris-弗吉尼亚 3:Iris-弗吉尼亚 0.976
6 1:Iris-setosa 1:Iris-setosa 1
7 1:Iris-setosa 1:Iris-setosa 1
..... ... ...
总共10个测试数据集。(每个15个实例)。
======================
由于 WEKA 使用启动交叉验证,测试数据集中的实例是随机选择的。
那么,如何打印测试数据的索引w.r.t原始文件中的数据?
即
inst#实际预测误差预测
1 3:Iris-弗吉尼亚 3:Iris-弗吉尼亚 0.976
这个结果是主要数据中的哪个实例(总共50个Iris-virginica)?
===============
经过大量搜索,我发现下面的 youtube 视频对解决上述问题很有帮助。
希望这对以后有相同疑问的访问者有所帮助。
Weka Tutorial 34: Generating Stratified Folds (Data Preprocessing)