通过 Hue 更新 HDFS 中的文件

Update file in HDFS through Hue

我知道HDFS是一次写入多次读取类型。据我所知,不可能在 HDFS 中更新文件(运行domly),因为文件存储在分布式环境中(作为块),每个块都复制到其他节点上,这对于数据节点来说很难甚至更新这些复制的块。

但是,我的问题是可以使用 hue 工具更新 HDFS 中的文件吗?因为,我已经使用 hue 工具和 运行 map-reduce 作业更新了许多文件(存储在 HDFS 中)。那么,hue怎么可能更新HDFS中的文件呢。 hue 是否在后台执行某些操作?通过 hue 进行的更新是否真的更新到同一个文件?或者 hue 删除文件并重新写入整个文件(包括我们要更新的新数据)?

Hue 删除并重新写入整个文件,因为 HDFS 不支持版本。您可以注意到 Hue 暂时将版本限制为小文件。

这是一个博客 post 以了解有关 HDFS Filebrowser 的更多信息。