HDFS 中使用的术语是否清晰?
Clarity of terms used in HDFS?
我在熟悉 HDFS 的过程中遇到了几个术语。很少有术语像:namespace
、metadata
、transaction logs
、fsimage
、editlogs
、
有时似乎所有这些术语描述的是同一个事物,即"having some information",但我对此不太清楚。
一般来说,metadata
表示关于数据的数据,所以 metadata
指的是所有这些术语,或者所有这些术语在 Hadoop HDFS 上下文中都有不同的用途?
Namepace : 在 hadoop 中 'namespace' 指的是文件名及其路径由名称节点维护。
Metadata :它包括文件名、大小、权限等...
此元数据存储在名为 fsimage.
的文件中
fsimage : hdfs 文件系统在某个时间点的完整状态。
对文件系统所做的任何更改不会立即写入fsimage,但有存储在一个名为 editlog.
的单独文件中(与存储 fsimage 的位置相同)
editlogs: 这是一个日志,列出了在最近的 fsimage 之后所做的每个文件系统更改。
我在熟悉 HDFS 的过程中遇到了几个术语。很少有术语像:namespace
、metadata
、transaction logs
、fsimage
、editlogs
、
有时似乎所有这些术语描述的是同一个事物,即"having some information",但我对此不太清楚。
一般来说,metadata
表示关于数据的数据,所以 metadata
指的是所有这些术语,或者所有这些术语在 Hadoop HDFS 上下文中都有不同的用途?
Namepace : 在 hadoop 中 'namespace' 指的是文件名及其路径由名称节点维护。
Metadata :它包括文件名、大小、权限等... 此元数据存储在名为 fsimage.
的文件中fsimage : hdfs 文件系统在某个时间点的完整状态。
对文件系统所做的任何更改不会立即写入fsimage,但有存储在一个名为 editlog.
的单独文件中(与存储 fsimage 的位置相同)editlogs: 这是一个日志,列出了在最近的 fsimage 之后所做的每个文件系统更改。