dfs.replication.max 是什么意思

what is the meaning of dfs.replication.max

关于 HDFS

dfs.replication.max 是什么意思?

来自文档 - https://hadoop.apache.org/docs/r2.6.0/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml

它只是说 - 最大块复制

但是还是不明白这个意思

让我们考虑一下。我们有一个最小复制,这通常是 3.

为什么有最大值?也许你做了很多维护工作,并定期从集群中取出一个节点。您可能最终会 [取出节点] 并 [将节点替换回] 集群,并且有理由认为一个块的 4 个副本可能会随着节点的离开和返回而发生。这可能是一个很好的情况,因为您的定期维护有一个额外的副本,这样维护并不总是需要大量的复制。您可能会接受 4 个副本作为复制的最大值。在极端情况下,如果您有一个文件的 50 个副本,这可能会有点失控,因为这只是太多的重复并且开始吃掉 hdfs space。将最大值视为您可能开始剔除额外副本的时间。