R 从多个 XML 文件中构建一个 xml 语料库
R Build an xml corpus out of multiple XML files
我正在尝试处理 xml 文件的语料库以进行文本挖掘。有没有一种方法可以将多个文件导入一个 xml object/database 以便以后可以与 XPath 一起使用?
这样做明智吗?我发现了一个类似的报告,将 xml 文件导入其他数据格式,例如数据帧或 tm Corpus 对象 Parsing multiple xml files to a Single Dateframe in R,但是将它们保持在 XML 格式应该使它们保持整洁,保持对由于漂亮的查询语言,带注释的语料库可以有很深的树并使处理更简单?
非常感谢咨询
我发现这个名为 mergex.exe 的小程序很有用。它在命令行将多个 XML 文件合并为一个文件,非常直观和简单。
我正在尝试处理 xml 文件的语料库以进行文本挖掘。有没有一种方法可以将多个文件导入一个 xml object/database 以便以后可以与 XPath 一起使用?
这样做明智吗?我发现了一个类似的报告,将 xml 文件导入其他数据格式,例如数据帧或 tm Corpus 对象 Parsing multiple xml files to a Single Dateframe in R,但是将它们保持在 XML 格式应该使它们保持整洁,保持对由于漂亮的查询语言,带注释的语料库可以有很深的树并使处理更简单?
非常感谢咨询
我发现这个名为 mergex.exe 的小程序很有用。它在命令行将多个 XML 文件合并为一个文件,非常直观和简单。