给定语言的维基数据条目数量
Amount of Wikidata entries in a given language
我想知道在 5000 万个条目的总数中,如何找出维基数据中每种语言有多少个标签。
例如,在 https://query.wikidata.org 中,对于加泰罗尼亚语 ("ca"),我尝试使用
SELECT ?lang (COUNT(DISTINCT ?item) AS ?count) WHERE {
?item schema:inLanguage "ca" .
} GROUP BY ?lang
ORDER BY DESC (?count)
并得到了 703351 的结果,但我认为这是不正确的,因为我下载了维基数据转储(来自 https://dumps.wikimedia.org/wikidatawiki/entities/ ),并且我已经在加泰罗尼亚语中提取了超过两百万个标签(以及提取过程还是运行)
那么,关于我做错了什么的任何线索?
如上注释中所建议,使用 Quarry:
https://quarry.wmflabs.org/query/27976
USE wikidatawiki_p;
DESCRIBE wb_terms;
SELECT COUNT(*) FROM wb_terms
WHERE term_type = 'label' AND term_language = "ca";
我想知道在 5000 万个条目的总数中,如何找出维基数据中每种语言有多少个标签。
例如,在 https://query.wikidata.org 中,对于加泰罗尼亚语 ("ca"),我尝试使用
SELECT ?lang (COUNT(DISTINCT ?item) AS ?count) WHERE {
?item schema:inLanguage "ca" .
} GROUP BY ?lang
ORDER BY DESC (?count)
并得到了 703351 的结果,但我认为这是不正确的,因为我下载了维基数据转储(来自 https://dumps.wikimedia.org/wikidatawiki/entities/ ),并且我已经在加泰罗尼亚语中提取了超过两百万个标签(以及提取过程还是运行)
那么,关于我做错了什么的任何线索?
如上注释中所建议,使用 Quarry:
https://quarry.wmflabs.org/query/27976
USE wikidatawiki_p;
DESCRIBE wb_terms;
SELECT COUNT(*) FROM wb_terms
WHERE term_type = 'label' AND term_language = "ca";