为我的大学创建本体的语义数据库。这有多难?

Creating a Semantic database of ontologies for my University. How difficult can it be?

我的大学有一篇论文,其中的目标是为大学创建一个语义数据库(我猜是 DBPedia 的补充)。 了解有关语义 Web 工作原理的一些基本知识,以及有关 OWL 的一些基本知识,这听起来并不容易,但也不难。 但是我的教授坚持说这需要很多时间。 如果有人了解语义网,我想听听意见。 我不是在寻找细节之类的。只是根据您的经验,关于您认为这样的事情是容易还是困难的意见。 谢谢阅读。

在大学时代,我曾与 多媒体信息系统研究小组 一起工作,该小组专注于语义网络。

我会尽量从一个角度回答你的问题,但还有很多其他的可能。我假设您想将大学多年来产生的一些非语义文本转换成更有条理的东西。 RDF 对此很有帮助。

NLP有很多工具可以帮助您解析文本。下一步是将 NLP 的输出转换为某种形式的 RDF。这也应该相当简单。编写原型就像您所说的那样 "not really hard"。为什么你的教授认为这是大量的工作,因为很难从文本中获得有用的三元组。在 DBPedia 中,您可以提取句子的 verb 并将其设为 predicate。传出 link 是您的 object,引用页面是您的 subject。如果没有 link 唯一标识一个概念,您将无法使用同音异义词。您需要以某种方式将文本绑定到 RDF URI。

清理数据会花费很多时间。