如何捕获有关 HDFS 上文件的信息
How do I capture information about files that are on HDFS
我想捕获有关 HDFS 中每个文件的某些信息,例如:名称、创建日期、修改和上次访问。我考虑过使用 Python OS 模块来做,但我不确定是否可行以及如何做。我想到的另一种选择是使用 HDFS 模块本身,但是互联网上关于它的信息很少,因此更加困难。
有人知道我会怎么做吗?
我想捕获有关 HDFS 中每个文件的某些信息,例如:名称、创建日期、修改和上次访问。我考虑过使用 Python OS 模块来做,但我不确定是否可行以及如何做。我想到的另一种选择是使用 HDFS 模块本身,但是互联网上关于它的信息很少,因此更加困难。
有人知道我会怎么做吗?