已解析的 RDF/XML 三元组中乱码的含义?

Meaning of messy code in parsed RDF/XML triples?

我使用下面的代码解析 RDF 并在 excel 中获得三元组。

import rdflib
import pandas as pd

g = rdflib.Graph()
g.load('https://standards.buildingsmart.org/IFC/DEV/IFC4/ADD2_TC1/OWL/')

lst_s = []
lst_p = []
lst_o = []

for s, p, o in g:
    lst_s.append(s)
    lst_p.append(p)
    lst_o.append(o)

df = pd.DataFrame(list(zip(lst_s,lst_p,lst_o)), columns=['s','p','o'])
df.to_excel("ifc owl.xlsx") 

我发现有这样一些乱七八糟的代码:

我查看了N个三元组格式,发现上面excel中突出显示的三元组如下: 乱码好像是“genid2542?”。这么乱码是什么意思?是因为解析错误还是对应了一些意思?谢谢!

只是转贴评论中的一些点作为可以采纳的答案:

这些标识符指的是在现实世界中没有身份的RDF空白节点(https://w3.org/TR/rdf11-concepts/#section-blank-nodes)。每个文档都是唯一的。

请记住,接触空白节点的每个工具不仅是免费的,而且在某些情况下必须,将它们重写为不同的。