Hive - 根据文件路径设置外部 table 的分区

Hive - set partitioning of external table based on file path

我的工作是按照以下格式将文件写入 hdfs:

/table_name/yyyy/MM/dd/HH/mm/ss/file_name.avro

是否可以在不移动文件和重命名目录的情况下定义按年份和时间戳 (HH:mm:ss) 分区的 Hive 外部 table?

您可以通过为每个 yyyy/HH/mm/ss 实例编写加载数据语句来实现。

LOAD DATA INPATH '/table_name/yyyy/MM/dd/HH/mm/ss/file_name.avro' INTO TABLE tablename PARTITION (year=yyyy, hour=HH, minute=mm, second=ss)