在 Orange 数据挖掘工具包中,如何指定交叉验证组?

In the Orange data mining toolkit, how do I specify groups for cross-validation?

我正在使用 Orange GUI,并尝试执行交叉验证。我的数据有 8 个不同的组(由输入数据中的变量指定),我希望每个折叠都包含一个不同的组。使用 Orange 可以做到吗?我可以 select 交叉验证的折叠数,但我看不到任何方法来确定每个折叠中有哪些数据。

交叉验证进行随机抽样。我不认为你想要的是开箱即​​用的。

如果你真的想让它尊重你事先所做的分割(根据一些输入变量),并且你不怕一些体力劳动,你可以使用Select Rows 小部件到 select 一组的行(即 匹配数据 ),将其传递到 Test & Score作为测试数据,并将所有其余数据(即不匹配数据)作为训练数据。这样,您就可以得到单折(组)的交叉验证。重复,最后平均,以获得所有折叠的结果。

如果您知道一些 Python,总有 Orange 脚本层可供您回退。