在 MapReduce 中有更多的 reducer 有什么优点和缺点?

What is the advantages and disadvantages of having more reducers in MapReduce?

MapReduce 编程都是关于并行处理的,那么为什么我们在许多情况下从单个 reducer 开始。在 MapReduce 中使用更多的 reducer 有什么优点和缺点?

一个 reducer 可能在一个或多个分区上工作,因此它限制了并行化,因为它只有一个。

reducer 太多会导致创建太多 small HDFS(输出)文件,这不好,并且会给 HDFS 带来压力,因为需要进行内务处理完成。