如何 select 从目录到 Mapreduce 程序的特定输入文件

How to select a specific input file from directory to Mapreduce program

我是 运行 一个 Mapreduce 程序,我的输入目录有多个文件。比方说

而且我只想与 file2.txt 一起工作。如何在不删除输入目录中剩余文件的情况下执行此操作?

您可以在代码中指定文件名

代码:

 FileInputFormat.addInputPath(job, "/inputfoldername/file2.txt");

或者您可以在 运行 时间

代码:

 FileInputFormat.addInputPath(job, new Path(args[0]));

执行:

 hadoop jar Wordcount.jar Wordcount /inputfoldername/file2.txt /outputfoldername

有关更多详细信息,请参阅 https://ybhavesh.blogspot.com

上提供的几个 Mapreduce POC

希望对您有所帮助!!!...