如何 select 从目录到 Mapreduce 程序的特定输入文件
How to select a specific input file from directory to Mapreduce program
我是 运行 一个 Mapreduce 程序,我的输入目录有多个文件。比方说
file1.txt
file2.txt
file3.txt
而且我只想与 file2.txt 一起工作。如何在不删除输入目录中剩余文件的情况下执行此操作?
您可以在代码中指定文件名
代码:
FileInputFormat.addInputPath(job, "/inputfoldername/file2.txt");
或者您可以在 运行 时间
代码:
FileInputFormat.addInputPath(job, new Path(args[0]));
执行:
hadoop jar Wordcount.jar Wordcount /inputfoldername/file2.txt /outputfoldername
有关更多详细信息,请参阅 https://ybhavesh.blogspot.com
上提供的几个 Mapreduce POC
希望对您有所帮助!!!...
我是 运行 一个 Mapreduce 程序,我的输入目录有多个文件。比方说
file1.txt
file2.txt
file3.txt
而且我只想与 file2.txt 一起工作。如何在不删除输入目录中剩余文件的情况下执行此操作?
您可以在代码中指定文件名
代码:
FileInputFormat.addInputPath(job, "/inputfoldername/file2.txt");
或者您可以在 运行 时间
代码:
FileInputFormat.addInputPath(job, new Path(args[0]));
执行:
hadoop jar Wordcount.jar Wordcount /inputfoldername/file2.txt /outputfoldername
有关更多详细信息,请参阅 https://ybhavesh.blogspot.com
上提供的几个 Mapreduce POC希望对您有所帮助!!!...