HDFS 块存储

HDFS block storage

1)由于NameNode不允许DataNode拥有同一个block的多个replicas,所以创建的最大replicas数量是当时DataNodes的总数。

参考:https://hadoop.apache.org/docs/r3.1.1/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html#Simple_Coherency_Model(在副本放置:第一步中)

这意味着如果你有 2 个数据节点,你的复制因子不能是 3。

2) 您的文件大小将相同。但是,使用三个副本会增加存储开销。我的意思是如果您的文件是 2 GB 怎么办。您将文件与 3 个副本一起使用。这意味着您要为文件分配 6 GB(2 GB 用于原始文件,2+2 GB 用于副本)存储空间 space。