维基数据 "Truthy" 数据转储

Wikidata "Truthy" data dump

我正在启动一个关于知识库的项目,想从下载最近的维基数据转储开始。我找到了一个名为 "truthy" 的数据转储,但我不确定是否可以信任它。

我对流行文化的理解是,"truthy" 陈述是 正确且 based only on intuition and perception 的陈述。谢谢,科尔伯特先生。

为什么维基数据会生成 "truthy" 数据不准确的数据转储?

同样令人困惑的是存在相互矛盾的定义。例如,这里是直接来自 WikiMedia 组织的 definition of "truthy" data

Truthy statements represent statements that have the best non-deprecated rank for given property. Namely, if there is a preferred statement for property P2, then only preferred statements for P2 will be considered truthy.

对我来说,这句话意味着真实的陈述(事实三元组)是首选。

这个 other webpage 说的是 "truthy":

This contains only “truthy” or “best” statements, without qualifiers or references.

我对此有何看法?这个"truthy"数据靠谱吗?

在维基数据中,每个 statement has an associated rank:首选排名、正常排名、弃用排名。默认值是正常排名,但每个人(注册用户和匿名用户)都可以将排名更改为其他值之一。没有强制执行如何分配等级的规则。通常,已弃用等级用于已证明的故障。首选排名通常用于时间序列中的最新值。

"truthy" 数据转储不包含任何具有弃用级别的语句,如果存在具有正常和首选级别的语句,则转储中只有具有首选级别的语句。

如果您想与维基数据社区取得联系,请访问 Wikidata project chat. If you prefer to communicate directly with the developpers of Wikidata/Wikibase, go to this page