已解析的 RDF/XML 三元组中乱码的含义?
Meaning of messy code in parsed RDF/XML triples?
我使用下面的代码解析 RDF 并在 excel 中获得三元组。
import rdflib
import pandas as pd
g = rdflib.Graph()
g.load('https://standards.buildingsmart.org/IFC/DEV/IFC4/ADD2_TC1/OWL/')
lst_s = []
lst_p = []
lst_o = []
for s, p, o in g:
lst_s.append(s)
lst_p.append(p)
lst_o.append(o)
df = pd.DataFrame(list(zip(lst_s,lst_p,lst_o)), columns=['s','p','o'])
df.to_excel("ifc owl.xlsx")
我发现有这样一些乱七八糟的代码:
我查看了N个三元组格式,发现上面excel中突出显示的三元组如下:
乱码好像是“genid2542?”。这么乱码是什么意思?是因为解析错误还是对应了一些意思?谢谢!
只是转贴评论中的一些点作为可以采纳的答案:
这些标识符指的是在现实世界中没有身份的RDF空白节点(https://w3.org/TR/rdf11-concepts/#section-blank-nodes)。每个文档都是唯一的。
请记住,接触空白节点的每个工具不仅是免费的,而且在某些情况下必须,将它们重写为不同的。
我使用下面的代码解析 RDF 并在 excel 中获得三元组。
import rdflib
import pandas as pd
g = rdflib.Graph()
g.load('https://standards.buildingsmart.org/IFC/DEV/IFC4/ADD2_TC1/OWL/')
lst_s = []
lst_p = []
lst_o = []
for s, p, o in g:
lst_s.append(s)
lst_p.append(p)
lst_o.append(o)
df = pd.DataFrame(list(zip(lst_s,lst_p,lst_o)), columns=['s','p','o'])
df.to_excel("ifc owl.xlsx")
我发现有这样一些乱七八糟的代码:
我查看了N个三元组格式,发现上面excel中突出显示的三元组如下:
只是转贴评论中的一些点作为可以采纳的答案:
这些标识符指的是在现实世界中没有身份的RDF空白节点(https://w3.org/TR/rdf11-concepts/#section-blank-nodes)。每个文档都是唯一的。
请记住,接触空白节点的每个工具不仅是免费的,而且在某些情况下必须,将它们重写为不同的。