在 hdfs 上格式化 namenode 后如何格式化 datanodes?

How to format datanodes after formatting the namenode on hdfs?

我最近一直在伪分布式模式下设置 hadoop,我创建了数据并将其加载到 HDFS 中。后来因为一个问题格式化了namenode。现在,当我这样做时,我发现之前在数据节点上已经存在的目录和文件不再显示了。 (虽然"Formatting"这个词是有道理的)但是现在,我确实有这个疑问。由于名称节点不再保存文件的元数据,是否会中断对先前加载文件的访问?如果是,那么我们如何删除数据节点上已有的数据?

你以前的数据节点目录现在已经过时了,是的。

您需要手动遍历每个数据节点并删除这些目录的内容。通过 Hadoop CLI 没有这样的格式命令

默认情况下,数据节点目录是/tmp下的单个文件夹

否则,您已经配置了 XML 文件存储数据的位置

Where HDFS stores data