"equivalent webpages" 在 Freebase 中是什么意思?
What is the meaning of "equivalent webpages" in Freebase?
我开始在 Freebase 上工作。我对网页有些困惑:
在接下来的 link 中,他们将 等效网页 描述为指向外部网页的链接。这些外部页面是维基百科页面和 Freebase 页面、IMDb 页面等。
"outside pages"是什么意思?没看懂,外面到底是什么?它在实体之外吗?
Barack Obama 的外部页面是:
- http://www.nytimes.com/top/reference/timestopics/people/o/barack_obama
- http://www.nndb.com/people/208/000055043/
- http://bioguide.congress.gov/scripts/biodisplay.pl?index=O000167
- http://openlibrary.org/authors/OL529531A
- http://www.myspace.com/barackobama
- http://www.tvrage.com/person/id-82898
- http://id.loc.gov/authorities/names/n94112934.html
- http://viaf.org/viaf/52010985/
- http://de.wikipedia.org/wiki/index.html?curid=297666
- http://fr.wikipedia.org/wiki/index.html?curid=167398
这些页面对于 "Barack Obama" 来说是独一无二的吗?我们不能将它们视为唯一标识符。
这些是实体 "Barack Obama" 出现的页面吗?
这个答案可能含糊不清,因为我没有 freebase 的副本。基于您提供的 link,尽管它们似乎 links/uris 以某种方式用作 Topic Equivalent Webpage 属性 的值。 topic_equivalent_webpage
有一个描述:
Webpages which are singular in focus describing a Topic. (i.e., a page which is only about the Topic.)
他们就是这样 - 他们只有一个焦点,描述主题(在这种情况下是巴拉克奥巴马),并且可以来自 Web 上的任何地方。我不确定 freebase 中的误报,所以我会谨慎地将它们视为该主题的唯一标识符。我觉得这些更像是语义 Web 术语中的 rdfs:seeAlso
个值,而不是 equivalent/sameAs 个实体。您可以 运行 在知识库中进行一些检查:
您可以检查这些页面与巴拉克奥巴马实体之间是否有任何owl:sameAs
link。在那种情况下,您可以认为它们在绝对意义上是等价的(例如,关于巴拉克奥巴马的任何断言都可以传播并适用于 "equivalent" entity/page)。同样,在您的 KB/freebase.
的上下文中
假设这些是 topic_equivalent_webpage
属性 的值,您可以检查 属性 是否有 rdfs:subPropertyOf
或 owl:equivalentProperty
与 owl:sameAs
的关系。在这种情况下,您的知识库会将它们视为等同的。
其中绝大多数可以被认为是强标识符。您可以通过查看“键”选项卡来判断哪些键 https://www.freebase.com/m/02mjmr?keys=
这是 Freebase 最大的优势之一,大量经过协调的实体标识符可用于各种不同的外部信息源(维基百科、IMDB、MusicBrainz、国会图书馆等)。
每个键都与一个名称space相关联,其中它是唯一的,并且每个名称space都有一个关联的 URI 模板,该模板用于从键构造 URI。例如,Congressional Bioguide URL 与由国会图书馆控制的名称space 相关联,并填充了用于识别立法者的 THOMAS ID。
Freebase 用户可以(或曾经)添加其他完整的 URL,但这很少发生。但是,如果您使用密钥,则可以保证只获得强标识符,而不是随机的 URLs.
编辑:这是它们在批量 Freebase RDF 转储中的样子:
<http://rdf.freebase.com/ns/m.010q36> <http://rdf.freebase.com/ns/common.topic.topic_equivalent_webpage> <http://openlibrary.org/authors/OL514554A> .
<http://rdf.freebase.com/ns/m.010q36> <http://rdf.freebase.com/ns/book.author.openlibrary_id> "OL514554A" .
<http://rdf.freebase.com/ns/m.010q36> <http://rdf.freebase.com/ns/type.object.key> "/authority/openlibrary/author/OL514554A" .
<http://rdf.freebase.com/ns/m.010q36> <http://rdf.freebase.com/key/authority.openlibrary.author> "OL514554A" .
为更好地表达而缩写:
<s> <fb:/ns/common.topic.topic_equivalent_webpage> <http://openlibrary.org/authors/OL514554A> .
<s> <fb:/ns/book.author.openlibrary_id> "OL514554A" .
<s> <fb:/ns/type.object.key> "/authority/openlibrary/author/OL514554A" .
<s> <fb:/key/authority.openlibrary.author> "OL514554A" .
单个 OpenLibrary 标识符以四种不同的形式呈现,这有点过分,重要的是 /authority
名称 space 中的任何内容都可以作为强标识符。
我开始在 Freebase 上工作。我对网页有些困惑:
在接下来的 link 中,他们将 等效网页 描述为指向外部网页的链接。这些外部页面是维基百科页面和 Freebase 页面、IMDb 页面等。
"outside pages"是什么意思?没看懂,外面到底是什么?它在实体之外吗?
Barack Obama 的外部页面是:
- http://www.nytimes.com/top/reference/timestopics/people/o/barack_obama
- http://www.nndb.com/people/208/000055043/
- http://bioguide.congress.gov/scripts/biodisplay.pl?index=O000167
- http://openlibrary.org/authors/OL529531A
- http://www.myspace.com/barackobama
- http://www.tvrage.com/person/id-82898
- http://id.loc.gov/authorities/names/n94112934.html
- http://viaf.org/viaf/52010985/
- http://de.wikipedia.org/wiki/index.html?curid=297666
- http://fr.wikipedia.org/wiki/index.html?curid=167398
这些页面对于 "Barack Obama" 来说是独一无二的吗?我们不能将它们视为唯一标识符。
这些是实体 "Barack Obama" 出现的页面吗?
这个答案可能含糊不清,因为我没有 freebase 的副本。基于您提供的 link,尽管它们似乎 links/uris 以某种方式用作 Topic Equivalent Webpage 属性 的值。 topic_equivalent_webpage
有一个描述:
Webpages which are singular in focus describing a Topic. (i.e., a page which is only about the Topic.)
他们就是这样 - 他们只有一个焦点,描述主题(在这种情况下是巴拉克奥巴马),并且可以来自 Web 上的任何地方。我不确定 freebase 中的误报,所以我会谨慎地将它们视为该主题的唯一标识符。我觉得这些更像是语义 Web 术语中的 rdfs:seeAlso
个值,而不是 equivalent/sameAs 个实体。您可以 运行 在知识库中进行一些检查:
您可以检查这些页面与巴拉克奥巴马实体之间是否有任何
owl:sameAs
link。在那种情况下,您可以认为它们在绝对意义上是等价的(例如,关于巴拉克奥巴马的任何断言都可以传播并适用于 "equivalent" entity/page)。同样,在您的 KB/freebase. 的上下文中
假设这些是
topic_equivalent_webpage
属性 的值,您可以检查 属性 是否有rdfs:subPropertyOf
或owl:equivalentProperty
与owl:sameAs
的关系。在这种情况下,您的知识库会将它们视为等同的。
其中绝大多数可以被认为是强标识符。您可以通过查看“键”选项卡来判断哪些键 https://www.freebase.com/m/02mjmr?keys=
这是 Freebase 最大的优势之一,大量经过协调的实体标识符可用于各种不同的外部信息源(维基百科、IMDB、MusicBrainz、国会图书馆等)。
每个键都与一个名称space相关联,其中它是唯一的,并且每个名称space都有一个关联的 URI 模板,该模板用于从键构造 URI。例如,Congressional Bioguide URL 与由国会图书馆控制的名称space 相关联,并填充了用于识别立法者的 THOMAS ID。
Freebase 用户可以(或曾经)添加其他完整的 URL,但这很少发生。但是,如果您使用密钥,则可以保证只获得强标识符,而不是随机的 URLs.
编辑:这是它们在批量 Freebase RDF 转储中的样子:
<http://rdf.freebase.com/ns/m.010q36> <http://rdf.freebase.com/ns/common.topic.topic_equivalent_webpage> <http://openlibrary.org/authors/OL514554A> .
<http://rdf.freebase.com/ns/m.010q36> <http://rdf.freebase.com/ns/book.author.openlibrary_id> "OL514554A" .
<http://rdf.freebase.com/ns/m.010q36> <http://rdf.freebase.com/ns/type.object.key> "/authority/openlibrary/author/OL514554A" .
<http://rdf.freebase.com/ns/m.010q36> <http://rdf.freebase.com/key/authority.openlibrary.author> "OL514554A" .
为更好地表达而缩写:
<s> <fb:/ns/common.topic.topic_equivalent_webpage> <http://openlibrary.org/authors/OL514554A> .
<s> <fb:/ns/book.author.openlibrary_id> "OL514554A" .
<s> <fb:/ns/type.object.key> "/authority/openlibrary/author/OL514554A" .
<s> <fb:/key/authority.openlibrary.author> "OL514554A" .
单个 OpenLibrary 标识符以四种不同的形式呈现,这有点过分,重要的是 /authority
名称 space 中的任何内容都可以作为强标识符。