Apache Sqoop-1 reducer 阶段

Apache Sqoop-1 reducer phase

我已经浏览了 sqoop 文档,但没有找到关于为什么 sqoop-1 没有 reducer 阶段的信息。有人可以解释一下吗。

当所有任务可以并行执行时,不需要减少阶段。

The purpose of the Reducer is to aggregate the input values and return a single output value.

查看 MapReduce 中 WordCount 的简单示例。 Reducer 用于聚合单个单词的出现次数。

由于 Sqoop 作业的本质是从给定的 RDBMS 中获取输入记录并将记录放入 HDFS 中的给定输出目录或 Hive table,该作业不需要任何聚合因此不需要 Reduce 阶段。

Sqoop 不需要 reducer,因为它 imports/exports RDBMS 和 HDFS 文件系统(或 Hive 表)之间的数据。

由于 RDBMS 由结构化数据组成,因此不需要洗牌或排序,并且可以在映射器中自行完成聚合。