如何将hadoop序列文件转换成json格式?

How to convert hadoop sequence file to json format?

顾名思义,我正在寻找可以将现有数据从 hadoop 序列文件转换为 json 格式的工具。 我最初的谷歌搜索只显示了与 jaql 相关的结果,我正在拼命地尝试开始工作。

A​​pache 是否有任何工具可用于此目的?

注意: 我的本地机器上有 hadoop 序列文件,想获取相应 json 格式的数据。

实际上,我正在寻找一些 tool/utility,它将 hadoop 序列文件作为输入并产生 json 格式的输出。

谢谢

Apache Hadoop 可能是读取序列文件的好工具。

尽管开个玩笑,为什么不编写最简单的 Mapper java 程序,例如使用 Jackson 来序列化它看到的每个键值对?那将是一个非常容易编写的程序。

鉴于它如此普遍的要求,我认为一定有某种工具可以做到这一点。是的,编写代码应该很容易,但是如果您已经有了功能相同的东西,为什么还要这样做。 无论如何,我想出了使用 jaql 来完成它。对我有用的示例工作查询,

读取({类型:'hdfs',位置:'some_hdfs_file',选项:{转换器:'com.ibm.jaql.io.hadoop.converter.FromJsonTextConverter'}});