如何知道来自维基百科 XML Dump 的文章是否是列表?
How to know if an article from Wikipedia XML Dump is a List?
有一些指令可以判断文章是否为消歧页面。
我想知道是否有任何 directive/Wikimedia 模板用于将文章标记为列表?
到目前为止,我发现检查此信息的唯一方法是通过维基数据 P360 Property,但理想情况下,我想从维基百科 XML 转储中获取此信息。
文章中没有这样的信息,但是如果标题以"List of...".
开头,您可以查看标题
我不确定所有具有 Property:P360 的项目都是列表文章(例如一些消歧项目,如 Q3086), but you can access them by MediaWiki API:
https://www.wikidata.org/w/api.php?action=query&list=backlinks&bltitle=Property:P360&blnamespace=0&bllimit=500
所有列表条目在维基数据中被标记为 instance of Wikimedia list article (Q13406463). You can get all them by using WikidataQuery API:
http://wdq.wmflabs.org/api?q=claim[31:13406463]
目前他们是 216,685 (104,843 in enwiki)
您还可以过滤所有非消歧项目的P360项目:
http://wdq.wmflabs.org/api?q=claim[360] AND noclaim[31:4167410]
有一些指令可以判断文章是否为消歧页面。 我想知道是否有任何 directive/Wikimedia 模板用于将文章标记为列表?
到目前为止,我发现检查此信息的唯一方法是通过维基数据 P360 Property,但理想情况下,我想从维基百科 XML 转储中获取此信息。
文章中没有这样的信息,但是如果标题以"List of...".
开头,您可以查看标题我不确定所有具有 Property:P360 的项目都是列表文章(例如一些消歧项目,如 Q3086), but you can access them by MediaWiki API:
https://www.wikidata.org/w/api.php?action=query&list=backlinks&bltitle=Property:P360&blnamespace=0&bllimit=500
所有列表条目在维基数据中被标记为 instance of Wikimedia list article (Q13406463). You can get all them by using WikidataQuery API:
http://wdq.wmflabs.org/api?q=claim[31:13406463]
目前他们是 216,685 (104,843 in enwiki)
您还可以过滤所有非消歧项目的P360项目:
http://wdq.wmflabs.org/api?q=claim[360] AND noclaim[31:4167410]