如何对维基数据条目进行分类?

How to classify Wikidata items?

我正在尝试将项目分类为维基数据支持的主要类别: 通用、人物、组织、事件、作品、术语、地点、其他。 此处列出了这些类别: https://www.wikidata.org/wiki/Wikidata:List_of_properties

我找不到指定主要类别的 属性。我调查了 P31 "instance of" 属性 和 P279 "subclass of" 但它们不是我需要的。

例如 "IBM" P31 returns "public company" 和 "software house" 以及 "Swiss International Air Lines" returns "airline"。 所以我不能说他们都是组织.

有办法吗?

一个选项是检查项目的属性,所以 如果一个项目有 P21 "sex or gender" 那么它就是一个人(或动物)。 但我不认为这是稳定的,因为没有 属性 是强制性的。

我正在使用 Wikidata Toolkit 进行查询。

维基数据曾经有一个主要类型 属性 但它被删除以支持 instance of 和更灵活的模式。 您可以在 https://www.wikidata.org/wiki/Property_talk:P107

看到很多关于主要类型的存档讨论

您可能想查看位于 http://query.wikidata.org

的 SPARQL 端点

Q4830453 是商业企业/公司。 要查找属于公司或公司子类的所有项目,只需执行以下操作:

PREFIX wd: <http://www.wikidata.org/entity/>
PREFIX wdt: <http://www.wikidata.org/prop/direct/>

SELECT DISTINCT ?item
WHERE {
    ?item wdt:P31/wdt:P279* wd:Q4830453
}

查询需要一点时间,目前有150k条结果。