用于信息检索的文本文件

Textfiles for Information Retrieval

我正在搜索示例 .txt 文件以进行信息检索。 如果有关于一个主题的文档集(大约 20 个文档),例如体育、音乐等,那就太好了

谢谢

有很多可用的数据集,例如:

用于评估红外系统的数据集: http://www.daviddlewis.com/resources/testcollections/

更多红外数据集: http://boston.lti.cs.cmu.edu/callan/Data/

几个数据集的综合列表: http://zitnik.si/mediawiki/index.php?title=Datasets

经典新闻组数据集:http://scikit-learn.org/stable/datasets/twenty_newsgroups.html

更大,新闻文章:http://research.signalmedia.co/newsir16/signal-dataset.html