如何将 XML 数据导入 Hadoop

How can I import XML data into Hadoop

我对 Hadoop 很陌生,我想将半结构化数据 - XML 导入 HDFS。将 XML 数据从远程位置导入 HDFS 的方法有哪些以及用于它的任何开源工具? Flume 可以将 XML 数据导入 HDFS 吗?提前致谢

您可以尝试编写 use HDFS Java API 在 HDFS 中创建文件并将 XML 的全部内容写入每个文件。

是的,您也可以使用 flume,如果有大量 XML 文件是从源中生成的,并且希望被放入 HDFS 中。

您可以查看这些链接: http://www.dummies.com/how-to/content/log-data-with-flume-in-hdfs.html