为什么维基百科信息框中的一些信息在 DBpedia 上丢失了?

Why is some information from the Wikipedia infobox missing on DBpedia?

为什么维基百科信息框中的一些信息在 DBpedia 上丢失了?

例如,star Alpha Librae has property distance-from-earth in the infobox, but it isn't a property of the Alpha Librae dbpedia resource. On the other hand, star Betelgeuse has this piece of information on DBpedia)。许多其他明星的信息框中都有此距离信息,但在 DBpedia 资源中没有匹配的属性。

有没有一种方法可以使用 SPARQL 从 DBpedia 中提取这些缺失的信息,或者这是对 wiki 页面进行网络抓取的唯一方法?

DBpedia 页面显示了 DBpedia 拥有的所有数据 -- SPARQL 或其他查询都无法获取不存在的数据。

DBpedia 定期更新。它可能不会反映维基百科上的最新更改。

此外,提取器是一个活生生的项目,可能不会抓住您感兴趣的每一个 属性。

看着 Betelgeuse on Wikipedia, I see one distance in the infobox. Looking at Alpha_Librae,我看到 两个 距离。 DBpedia 应该有哪些?或许您拥有可以确保提取器做正确事情的利基知识...

正如@JoshuaTaylor 所说,您可能会从 the DBpedia discussion list and/or the DBpedia development list 那里得到更满意的答案。

看看en.wikipedia.org/wiki/Volkswagen_Golf_Mk3:

在信息​​框中您有:

身高 = 1991-95 和敞篷车:{{convert|1422|mm|in|1|abbr=on}}
1996-99:{ {convert|1428|mm|in|1|abbr=on}}

在 dbpedia 中你得到 身高=1991-95

而不是

身高=1442

身高=1428

发生这种情况是因为没有关于如何以有条件的方式定义属性的标准。因此,dbpedia 属性有时 wrong/missing