维基数据 "Truthy" 数据转储
Wikidata "Truthy" data dump
我正在启动一个关于知识库的项目,想从下载最近的维基数据转储开始。我找到了一个名为 "truthy" 的数据转储,但我不确定是否可以信任它。
我对流行文化的理解是,"truthy" 陈述是 不 正确且 based only on intuition and perception 的陈述。谢谢,科尔伯特先生。
为什么维基数据会生成 "truthy" 数据不准确的数据转储?
同样令人困惑的是存在相互矛盾的定义。例如,这里是直接来自 WikiMedia 组织的 definition of "truthy" data:
Truthy statements represent statements that have the best
non-deprecated rank for given property. Namely, if there is a
preferred statement for property P2, then only preferred statements
for P2 will be considered truthy.
对我来说,这句话意味着真实的陈述(事实三元组)是首选。
这个 other webpage 说的是 "truthy":
This contains only “truthy” or “best” statements, without qualifiers or references.
我对此有何看法?这个"truthy"数据靠谱吗?
在维基数据中,每个 statement has an associated rank:首选排名、正常排名、弃用排名。默认值是正常排名,但每个人(注册用户和匿名用户)都可以将排名更改为其他值之一。没有强制执行如何分配等级的规则。通常,已弃用等级用于已证明的故障。首选排名通常用于时间序列中的最新值。
"truthy" 数据转储不包含任何具有弃用级别的语句,如果存在具有正常和首选级别的语句,则转储中只有具有首选级别的语句。
如果您想与维基数据社区取得联系,请访问 Wikidata project chat. If you prefer to communicate directly with the developpers of Wikidata/Wikibase, go to this page。
我正在启动一个关于知识库的项目,想从下载最近的维基数据转储开始。我找到了一个名为 "truthy" 的数据转储,但我不确定是否可以信任它。
我对流行文化的理解是,"truthy" 陈述是 不 正确且 based only on intuition and perception 的陈述。谢谢,科尔伯特先生。
为什么维基数据会生成 "truthy" 数据不准确的数据转储?
同样令人困惑的是存在相互矛盾的定义。例如,这里是直接来自 WikiMedia 组织的 definition of "truthy" data:
Truthy statements represent statements that have the best non-deprecated rank for given property. Namely, if there is a preferred statement for property P2, then only preferred statements for P2 will be considered truthy.
对我来说,这句话意味着真实的陈述(事实三元组)是首选。
这个 other webpage 说的是 "truthy":
This contains only “truthy” or “best” statements, without qualifiers or references.
我对此有何看法?这个"truthy"数据靠谱吗?
在维基数据中,每个 statement has an associated rank:首选排名、正常排名、弃用排名。默认值是正常排名,但每个人(注册用户和匿名用户)都可以将排名更改为其他值之一。没有强制执行如何分配等级的规则。通常,已弃用等级用于已证明的故障。首选排名通常用于时间序列中的最新值。
"truthy" 数据转储不包含任何具有弃用级别的语句,如果存在具有正常和首选级别的语句,则转储中只有具有首选级别的语句。
如果您想与维基数据社区取得联系,请访问 Wikidata project chat. If you prefer to communicate directly with the developpers of Wikidata/Wikibase, go to this page。