Catboost 点击率设置
Catboost CTR settings
我将 catboost 用于具有分类数据的多分类任务。我正在检查 ctr 的默认参数,即从分类数据到数值数据的转换。据说ctr的默认值是"None".
据我所知,这是一个可选步骤。
该算法确实适用于我的数据集,所以我想知道它是否使用:
- 理解分类数据的梯度提升属性
- 或者它实际上使用了 Borders、Buckets、BinarizedTargetMeanValue、Counter 的默认方法
- 还是默认使用 example avg_target = (countInclass + prior) / (totalcount +1) 中给出的公式,看起来像 "Buckets"
In Multiclass CatBoost 使用 Buckets 方法计算 ctrs。
你写的公式是正确的。为每个 class 计算一个单独的 ctr 特征。这里的 countInClass 是在给定一个随机排列之前具有相同类别值且具有此 class 值的对象的计数。而 totalCount 是在给定相同类别值之前具有任何 class 值的对象数。
我将 catboost 用于具有分类数据的多分类任务。我正在检查 ctr 的默认参数,即从分类数据到数值数据的转换。据说ctr的默认值是"None".
据我所知,这是一个可选步骤。
该算法确实适用于我的数据集,所以我想知道它是否使用:
- 理解分类数据的梯度提升属性
- 或者它实际上使用了 Borders、Buckets、BinarizedTargetMeanValue、Counter 的默认方法
- 还是默认使用 example avg_target = (countInclass + prior) / (totalcount +1) 中给出的公式,看起来像 "Buckets"
In Multiclass CatBoost 使用 Buckets 方法计算 ctrs。
你写的公式是正确的。为每个 class 计算一个单独的 ctr 特征。这里的 countInClass 是在给定一个随机排列之前具有相同类别值且具有此 class 值的对象的计数。而 totalCount 是在给定相同类别值之前具有任何 class 值的对象数。