如何从 hadoop mapreduce 程序创建输出文件?

how to create output files from hadoop mapreduce program?

我是hadoop2.60的新手。我写了一个 MapReduce 算法。 数据集如下 1 贷款 1234

2贷234

1 asd 1234

1 个 1234

1 阿斯德 1267

2 qwer 1246

我希望如果 firstColumn 为 1,则该行的所有数据都应转到 file1-output 否则所有数据都应该转到 file2-output.

如何在 map-reduce 中实现。

是的,你可以做到。这可以通过 MultipleOutputFormat and using its generateFileNameForKeyValue 来实现。

使用 if 条件和 MultipleOutputFormat 可以轻松实现。

您可以查看此处以获取更多示例。 Is it possible to have multiple output files for a map-reduce?

希望能回答你的问题