如何知道来自维基百科 XML Dump 的文章是否是列表?

How to know if an article from Wikipedia XML Dump is a List?

有一些指令可以判断文章是否为消歧页面。 我想知道是否有任何 directive/Wikimedia 模板用于将文章标记为列表?

到目前为止,我发现检查此信息的唯一方法是通过维基数据 P360 Property,但理想情况下,我想从维基百科 XML 转储中获取此信息。

文章中没有这样的信息,但是如果标题以"List of...".

开头,您可以查看标题

我不确定所有具有 Property:P360 的项目都是列表文章(例如一些消歧项目,如 Q3086), but you can access them by MediaWiki API:

https://www.wikidata.org/w/api.php?action=query&list=backlinks&bltitle=Property:P360&blnamespace=0&bllimit=500

所有列表条目在维基数据中被标记为 instance of Wikimedia list article (Q13406463). You can get all them by using WikidataQuery API:

http://wdq.wmflabs.org/api?q=claim[31:13406463]

目前他们是 216,685 (104,843 in enwiki)

您还可以过滤所有非消歧项目的P360项目:

http://wdq.wmflabs.org/api?q=claim[360] AND noclaim[31:4167410]