Weka 3.7.11 中的随机树对数值属性使用什么分裂标准？

Question

我使用的是 Weka 3.7.11 中的 RandomForest，后者又是 bagging Weka 的 RandomTree。我的输入属性是数字，输出属性（标签）也是数字。

训练RandomTree时，为树的每个节点随机选择K个属性。尝试了几次基于这些属性的拆分，并选择了 "best" 一个。 Weka 如何确定在这种（数字）情况下最好的拆分方式？

对于标称属性，我相信 Weka 使用的是基于条件熵的 information gain 标准。

IG(T|a) = H(T) - H(T|a)

是否有类似的东西用于数字属性？也许是微分熵？

Answer 1

按数值属性拆分树时，按a>5等条件拆分。所以，这个条件实际上变成了二元变量，标准（信息增益）是完全相同的。

P.S。对于回归，常用的是误差平方和（对于每个叶子，然后对叶子求和）。但是我对 Weka

不是特别了解

What splitting criterion does Random Tree in Weka 3.7.11 use for numerical attributes?