R中的DTD解析错误

DTD parsing error in R

我对 r 中的 xml 树有点问题。我有一个树库,包含语料库——我真正需要的东西。我想要的是获取 XML 文件,在我的计算机上借助 DTD 解析它们,然后再创建一个语料库。

到目前为止我已经试过了

xmlTreeParse(doc, options=XML::DTDLOAD)

xmlParse(doc)

还有

parseDTD(dtd)

但它们都返回一个错误。前两个还是说"entity not defined",解析函数返回"failed to load external entity "yaddayadda.dtd""。在 this 问题中给出了 treeparse 函数作为答案,但它对我不起作用。 xml 文件具有系统“../yaddayadda.dtd”名称。

我打算用这个做的是,以某种方式从解析的文本中在 tm 包中创建一个 VCorpus 对象,以便在以后的文本挖掘研究中使用它。

你能帮帮我吗?如果需要,将提供更多详细信息。

您要加载 DTD 的解析器正在查看对“../yaddayadda.dtd”的引用,但没有找到它。

最可能的原因是您在相应的文件系统上没有名为 "yaddayadda.dtd" 的文件,或者您将它放在了错误的位置;解析器应该在引用它的 XML 文档的上一级目录中查找它。

如果您将它放在您认为正确的位置,那么显然您和解析器不同意正确的位置。祝你好运。