我可以使用哪些指标来验证和测试狐猴项目中 RankLib 库中的 RankNet?

What metrics can I use to validate and test RankNet in the RankLib library in the Lemur Project?

我目前正在将 RankNet 算法 (-ranker 4) 的 RankLib 实现与保留集一起使用。我在终端中使用 jar 文件 运行 this.

documentation规定:

metric2t (e.g. NDCG, ERR, etc) only applies to list-wise algorithms (AdaRank, Coordinate Ascent and LambdaMART). Point-wise and pair-wise techniques (MART, RankNet, RankBoost), due to their nature, always use their internal RMSE / pair-wise loss as the optimisation criteria.

但是,当我将 'metrics2t' 设置为 ERR@10 或 NDCG@10 时,它开始训练和验证我选择的指标而不是 'RMSE'。

This is part of the table outputted when I run RankNet with ERR@10.

有没有我遗漏的东西,因为这对我来说似乎是矛盾的。

谢谢。

我不确定,但是,我认为即使它打印了这些指标的结果,也没有针对它们进行优化。

库的开发人员只是将其留在那里,至于其他方法,通常使用这些指标之一进行验证。并且没有选项可以在训练期间简单地关闭指标计算。

现在我正在训练一个 RankNet 模型,似乎训练和验证数据的 ERR@10 实际上在增加,而“错误排序对的百分比”在减少。