protege(ontology 工具)可以在读取海龟文件时报告错误的行号吗?

Can protege (ontology tool) report line number of an error when reading a turtle file?

我正在生成 Turtle 三元组,完整的数据集已经大约 2GB。对于大多数测试,我只处理几 K 的小样本。然后我尝试对完整数据集进行定期测试。它从不一直加载,但它会告诉我是否有错误。

我的快速测试是将 ttl 文件加载到 protege 中。我使用的是 Protege 5.2(windows 版本)。小样本没有错误。但是当我更大的样本时,它 (protege) 读取我生成的 ttl 文件并告诉我有一个错误。

•   Level: INFO Time: 1504111914814 Message: ------------------------------- Loading Ontology ------------------------------- 
•   Level: INFO Time: 1504111914815 Message: Loading ontology from file:/C:/Projects/gdelt/sample.ttl 
•   Level: INFO Time: 1504112075814 Message: Finished loading file:/C:/Projects/gdelt/sample.ttl 
•   **Level: ERROR Time: 1504112075818 Message: An error occurred whilst loading the ontology at GC overhead limit exceeded. Cause: {}** 
•   Level: INFO Time: 1504112075819 Message: Loading for ontology and imports closure successfully completed in 160995 ms 

加载这些示例文件可能需要很长时间 - 然后它只告诉我有错误,但没有任何指示问题出在哪里。所以我目前的调试方法是二进制搜索——生成一半大的文件,看看是否有错误,拆分差异,检查错误,这样我就把它缩小到几行,我可以很容易地检测到错误.这真的乏味。有没有办法让保护者报告它呕吐的那条线?

如果没有,也许我可以使用另一种工具来检查我生成的三元组的语法?

解析器中没有出现内存不足错误,因此没有提供行号。您的内存限制可以加载的行数只能通过连续尝试来猜测。

最好的解决方法是增加 -Xmx 参数值。