YARN 是否负责通过 HDFS 分发数据

Is YARN responsible of distributing the data over HDFS

我是 Hadoop 的初学者,我不明白我们如何通过 HDFS 分发数据:

1- Manually   
2- with YARN
3- other ways to do it
4- Automatically

数据添加到 HDFS 时会自动复制。只需执行命令

hdfs dfs -copyFromLocal <local-file> <hdfs-location>

将在 HDFS 上放置一个复制因子为 3(默认)的文件。复制是完全自动化的,并且从用户那里抽象出来。