用于学习排名算法的良好查询文档数据集?

Good query-document dataset for learning to rank algorithm?

最近我开始研究一种学习排名算法,它涉及特征提取和排名。我在 Microsoft 研究网站上找到的著名学习排名算法数据集具有从文档中提取的查询 ID 和特征的数据集。有人可以建议我学习如何对数据集进行排名,这些数据集的原始形式具有良好的相关性判断查询文档对吗??。

Alex Rogozhnikov 跟踪一些可用于学习排名的数据集,检查 his blog post

您也可以使用 DBLP dataset, which was also used in a Learning to Rank task, check this paper: https://arxiv.org/pdf/1501.05132.pdf