impala/hive 显示文件格式

impala/hive show file format

如何让 impala 或 hive return HDFS 上的底层文件的文件格式用于 table?

我试过了:

SHOW FILES database.table_name

这就是文件,但问题是有些人将 parquet 文件存储为 .parq 而其他人存储为 .parquet。有没有 return 文件格式,以便可以在新的创建语句中使用它?

使用旧的show create table mytable
您可以检查输出,它清楚地提到了文件格式。它还显示存储文件的文件夹 - 你不应该尝试使用文件名 - 让 impala 决定名称。以下是 impala.

的示例结果
result  
CREATE TABLE edh.mytable (
  column1 STRING
 )
STORED AS PARQUET  --file format
LOCATION 's3a://cc-mys3/edh/user/hive/warehouse/edh.db/mytable' --folder location