RDF 中的度量单位本体有多实用?
How practical are units of measure ontologies in RDF?
我正在用 RDF 创建 material 的集合。我遇到过两种处理计量单位的方法:
- 通过将描述性名称链接到 RDF 属性:
prop:density prop:hasUnits "kg/m3".
<x:MyBrick> a x:Material;
prop:density "1676".`
- 使用现有的 ontology 库,例如 ontology of units of measure. It is much more complex to assign units as it involves creating multiple objects。请参阅下面我如何将相同的密度分配给 material:
<x:MyBrick> a x:Material;
om:hasPhenomenon <x:density_MyBrick>.
<x:density_MyBrick> a om:Density;
om:hasValue <x:1676_kilogramspercubicmetre>.
<x:1676_kilogramspercubicmetre> a om:Measure;
om:hasNumericalValue 1.676E3;
om:hasUnit om:kilogramPerCubicmetre .
我已经回顾了 using UOM ontologies 的不同用例,但主要关注的是他们可以做什么,而不是他们如何做以及是否实用。例如,我想如果您只想 return 指定 material 属性的所有值,那么使用单位 ontology 会使查询变得更加复杂。还有几个ontology没有涵盖的属性,比如表面粗糙度,不清楚如何扩展它们。
我更喜欢第一种方法。它更加简洁、灵活,并为用户提供了典型数据库中无法提供的有用信息。我会尝试在应用程序端处理单位转换,因此我的首要任务是以查询友好的方式存储信息。我担心的是,通过采用这种方法,我将进一步限制功能。选择一种方法相对于另一种方法有什么主要优点和缺点吗?
问题中提到的问题是 RDF 社区中的已知问题,已在 peer-reviewed 论文中讨论过。
关于问题中提到的第二种方法,有人可能认为使用中介来写是完全不自然的objects。然而,描述事物测量的本体可能是在考虑多个方面的情况下编写的。例如,在某个特定时刻某些东西膨胀的情况下,可能需要中介 objects 来指定这些测量的时间。当然,有些情况不需要这些额外的描述。
第一种方法的问题是它完全限制 prop:density
只有一个单元。如果您有不同单位的密度,则必须执行转换。
我认为在您的上下文中一个简单的解决方案是引入特定的数据类型。
@prefix x: <http://example.com/data> .
@prefix o: <http://example.com/ontology> .
x:MyBrick a x:Material;
o:density "1676"^^o:kg-m3.
在你的 ontology 和 IRI http://example.com/ontology
中,你可以进一步描述资源 o:kg-m3
。例如,您可以说它是一种数据类型,用于键入以千克/立方体为单位测量的密度,如下所示:
@prefix o: <http://example.com/ontology> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
o:kg-m3 a rdfs:Datatype;
rdfs:label "Kilogram per metric cube datatype (kg/)";
rdfs:comment "A datatype to type densities measured in kilogram per meter cube" .
o:kg-l a rdfs:Datatype;
rdfs:label "Kilogram per liter datatype";
rdfs:comment "A datatype to type densities measured in kilogram per liter cube" .
正如您在上面看到的,定义了一个额外的数据类型o:kg-l
。现在,使用相同的 属性,您可以指定以不同单位测量的密度。例如:
@prefix x: <http://example.com/data> .
@prefix o: <http://example.com/ontology> .
x:MyBrick1 a x:Material;
o:density "1676"^^o:kg-m3.
x:MyBrick2 a x:Material;
o:density "200"^^o:kg-l.
x:MyBrick3 a x:Material;
o:density "200a"^^o:kg-m3.
正如您在上面看到的,已经定义了 x:Material
的三个实例及其各自的 o:density
。看上面的三元组,你会注意到在最后一个三元组中,o:density
的值是200a
。您会同意该值不是 well-formed 密度值。此外,您可能想知道哪个 objects、x:MyBrick1
或 x:MyBrick2
具有更高的密度。一致的 RDF 三元组将无法识别最后一个三元组中的值不是 well-formed。同样,符合标准的 SPARQL 引擎将无法对 o:density
值执行代数运算。不过,您可以自定义 RDF 三重存储或 SPARQL 引擎的实现以满足这些需求。本文 [1] 描述了如何实现这一目标。
- Lefrançois、Maxime 和 Antoine Zimmermann。 "Supporting arbitrary custom datatypes in RDF and SPARQL." 欧洲语义网会议。斯普林格、查姆,2016 年。(https://www.emse.fr/~zimmermann/Papers/eswc2016.pdf)
我正在用 RDF 创建 material 的集合。我遇到过两种处理计量单位的方法:
- 通过将描述性名称链接到 RDF 属性:
prop:density prop:hasUnits "kg/m3".
<x:MyBrick> a x:Material;
prop:density "1676".`
- 使用现有的 ontology 库,例如 ontology of units of measure. It is much more complex to assign units as it involves creating multiple objects。请参阅下面我如何将相同的密度分配给 material:
<x:MyBrick> a x:Material;
om:hasPhenomenon <x:density_MyBrick>.
<x:density_MyBrick> a om:Density;
om:hasValue <x:1676_kilogramspercubicmetre>.
<x:1676_kilogramspercubicmetre> a om:Measure;
om:hasNumericalValue 1.676E3;
om:hasUnit om:kilogramPerCubicmetre .
我已经回顾了 using UOM ontologies 的不同用例,但主要关注的是他们可以做什么,而不是他们如何做以及是否实用。例如,我想如果您只想 return 指定 material 属性的所有值,那么使用单位 ontology 会使查询变得更加复杂。还有几个ontology没有涵盖的属性,比如表面粗糙度,不清楚如何扩展它们。
我更喜欢第一种方法。它更加简洁、灵活,并为用户提供了典型数据库中无法提供的有用信息。我会尝试在应用程序端处理单位转换,因此我的首要任务是以查询友好的方式存储信息。我担心的是,通过采用这种方法,我将进一步限制功能。选择一种方法相对于另一种方法有什么主要优点和缺点吗?
问题中提到的问题是 RDF 社区中的已知问题,已在 peer-reviewed 论文中讨论过。
关于问题中提到的第二种方法,有人可能认为使用中介来写是完全不自然的objects。然而,描述事物测量的本体可能是在考虑多个方面的情况下编写的。例如,在某个特定时刻某些东西膨胀的情况下,可能需要中介 objects 来指定这些测量的时间。当然,有些情况不需要这些额外的描述。
第一种方法的问题是它完全限制 prop:density
只有一个单元。如果您有不同单位的密度,则必须执行转换。
我认为在您的上下文中一个简单的解决方案是引入特定的数据类型。
@prefix x: <http://example.com/data> .
@prefix o: <http://example.com/ontology> .
x:MyBrick a x:Material;
o:density "1676"^^o:kg-m3.
在你的 ontology 和 IRI http://example.com/ontology
中,你可以进一步描述资源 o:kg-m3
。例如,您可以说它是一种数据类型,用于键入以千克/立方体为单位测量的密度,如下所示:
@prefix o: <http://example.com/ontology> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
o:kg-m3 a rdfs:Datatype;
rdfs:label "Kilogram per metric cube datatype (kg/)";
rdfs:comment "A datatype to type densities measured in kilogram per meter cube" .
o:kg-l a rdfs:Datatype;
rdfs:label "Kilogram per liter datatype";
rdfs:comment "A datatype to type densities measured in kilogram per liter cube" .
正如您在上面看到的,定义了一个额外的数据类型o:kg-l
。现在,使用相同的 属性,您可以指定以不同单位测量的密度。例如:
@prefix x: <http://example.com/data> .
@prefix o: <http://example.com/ontology> .
x:MyBrick1 a x:Material;
o:density "1676"^^o:kg-m3.
x:MyBrick2 a x:Material;
o:density "200"^^o:kg-l.
x:MyBrick3 a x:Material;
o:density "200a"^^o:kg-m3.
正如您在上面看到的,已经定义了 x:Material
的三个实例及其各自的 o:density
。看上面的三元组,你会注意到在最后一个三元组中,o:density
的值是200a
。您会同意该值不是 well-formed 密度值。此外,您可能想知道哪个 objects、x:MyBrick1
或 x:MyBrick2
具有更高的密度。一致的 RDF 三元组将无法识别最后一个三元组中的值不是 well-formed。同样,符合标准的 SPARQL 引擎将无法对 o:density
值执行代数运算。不过,您可以自定义 RDF 三重存储或 SPARQL 引擎的实现以满足这些需求。本文 [1] 描述了如何实现这一目标。
- Lefrançois、Maxime 和 Antoine Zimmermann。 "Supporting arbitrary custom datatypes in RDF and SPARQL." 欧洲语义网会议。斯普林格、查姆,2016 年。(https://www.emse.fr/~zimmermann/Papers/eswc2016.pdf)