hdfs 将多个文件复制到同一目标目录
hdfs copy multiple files to same target directory
我了解到,如果您想将多个文件从一个 hadoop 文件夹复制到另一个 hadoop 文件夹,您最好创建一个包含大量组件的大 'hdfs dfs -cp' 语句,而不是创建多个 hdfs dfs -cp 语句。
使用 'better' 我的意思是它会缩短复制文件所需的总时间:一个命令比几个单独的 -cp 命令 运行 一个接一个要快。
当我执行此操作并且我的目标目录与我要复制的所有文件相同时,我收到警告。
我正在执行以下命令:
hdfs dfs -cp -f /path1/file1 /pathx/target /path2/file2 /pathx/target /path3/file3 /pathx/target
执行后我收到以下警告:
cp: `/pathx/target' to `/pathx/target/target': is a subdirectory of itself
虽然我收到了这个奇怪的警告,但复制本身还是成功了。
这是一个错误还是我遗漏了什么?
尝试使用以下语法:
hadoop fs -cp /path1/file1 /path2/file2 path3/file3 /pathx/target
或者你可以这样做:
hadoop fs -cp /path1/{file1, file2, file3} /pathx/target
如果要复制所有文件,则:
hadoop fs -cp /path1/* /pathx/target
我了解到,如果您想将多个文件从一个 hadoop 文件夹复制到另一个 hadoop 文件夹,您最好创建一个包含大量组件的大 'hdfs dfs -cp' 语句,而不是创建多个 hdfs dfs -cp 语句。 使用 'better' 我的意思是它会缩短复制文件所需的总时间:一个命令比几个单独的 -cp 命令 运行 一个接一个要快。
当我执行此操作并且我的目标目录与我要复制的所有文件相同时,我收到警告。
我正在执行以下命令:
hdfs dfs -cp -f /path1/file1 /pathx/target /path2/file2 /pathx/target /path3/file3 /pathx/target
执行后我收到以下警告:
cp: `/pathx/target' to `/pathx/target/target': is a subdirectory of itself
虽然我收到了这个奇怪的警告,但复制本身还是成功了。 这是一个错误还是我遗漏了什么?
尝试使用以下语法:
hadoop fs -cp /path1/file1 /path2/file2 path3/file3 /pathx/target
或者你可以这样做:
hadoop fs -cp /path1/{file1, file2, file3} /pathx/target
如果要复制所有文件,则:
hadoop fs -cp /path1/* /pathx/target