估计维基数据的语句、项目、属性和映射到三元组的数量

Estimates on Wikidata number of statements, items, properties and mapping to triples

我正从其他知识库转到维基数据。我对维基数据的术语和大小有一些疑问。

  1. 一个 RDF Triple 包含一个 SubjectRelationObject 。是否有一对一的定义映射到包含 Item属性[= 的 Wikidata Statement 26=] 和 ?我正在关注 description of its data structure.
  2. 是否有明确的页面显示其中包含多少语句、独特项目和独特属性?我只找到 this Wikidata page 表示有大约 8700 万件商品。

对于(1),看一下https://www.mediawiki.org/wiki/Wikibase/DataModel/Primer and https://www.mediawiki.org/wiki/Wikibase/Indexing/RDF_Dump_Format。语句可能不仅仅是主语、谓语、宾语,因此映射更加复杂,并且可能需要许多三元组来描述单个语句。

对于 (2),有 public 个提供详细分析的 Graphana 仪表板。但是,仪表板太多,细节太多,似乎 https://grafana.wikimedia.org/dashboards/f/k0zbgDsik/wikidata-dashboards. For statements, I found https://grafana.wikimedia.org/d/000000175/wikidata-datamodel-statements?orgId=1&refresh=30m which sais that there are 1.1 billion statements on Wikidata. For Items and Properties (collectively called "entities"), I found https://grafana.wikimedia.org/d/000000167/wikidata-datamodel?orgId=1&refresh=30m,这告诉我大约有 8700 万个项目和大约 7500 个唯一属性。