Hive - 根据文件路径设置外部 table 的分区
Hive - set partitioning of external table based on file path
我的工作是按照以下格式将文件写入 hdfs:
/table_name/yyyy/MM/dd/HH/mm/ss/file_name.avro
是否可以在不移动文件和重命名目录的情况下定义按年份和时间戳 (HH:mm:ss) 分区的 Hive 外部 table?
您可以通过为每个 yyyy/HH/mm/ss 实例编写加载数据语句来实现。
LOAD DATA INPATH '/table_name/yyyy/MM/dd/HH/mm/ss/file_name.avro' INTO TABLE tablename PARTITION (year=yyyy, hour=HH, minute=mm, second=ss)
我的工作是按照以下格式将文件写入 hdfs:
/table_name/yyyy/MM/dd/HH/mm/ss/file_name.avro
是否可以在不移动文件和重命名目录的情况下定义按年份和时间戳 (HH:mm:ss) 分区的 Hive 外部 table?
您可以通过为每个 yyyy/HH/mm/ss 实例编写加载数据语句来实现。
LOAD DATA INPATH '/table_name/yyyy/MM/dd/HH/mm/ss/file_name.avro' INTO TABLE tablename PARTITION (year=yyyy, hour=HH, minute=mm, second=ss)