在 hadoop hdfs 中查看数据格式的最佳方式是什么？

Question

将近 50GB 的 CSV 文件加载到 Hadoop 集群中，我想查看一些示例记录以识别列。

我试过使用

hadoop fs -cat employees.csv | head -n 10

我的问题是

Answer 1

这取决于您的版本。

对于旧的 Hadoop (< 3.1.0) 版本：

hadoop fs -cat employees.csv | head -n 10

对于较新的 (>= 3.1.0) Hadoop 版本

 hadoop fs -head employees.csv

What is best way to see data format in hadoop hdfs?