Cloudera 5.6:Parquet 不支持日期。请参见 HIVE-6384

Cloudera 5.6: Parquet does not support date. See HIVE-6384

我目前正在使用 Cloudera 5.6 尝试在配置单元 table 中基于另一个 table 创建镶木地板格式 table,但我 运行 出错了。

create table sfdc_opportunities_sandbox_parquet like 
sfdc_opportunities_sandbox STORED AS PARQUET

错误信息

Parquet does not support date. See HIVE-6384

我读到 Hive 1.2 已修复此问题,但 Cloudera 5.6 和 5.7 未随 Hive 1.2 一起提供。有没有人找到解决这个问题的方法?

除了使用 TIMESTAMP or an other storage format like ORC 等其他数据类型外,如果依赖于所使用的 Hive 版本和 Parquet 文件存储格式,则可能没有其他办法。

根据 v1.1.0 中的 Clouderas CDH 5 Packaging and Tarball Information, the whole branch 5 comes packed with Apache Parquet in v1.5.0 and Apache Hive

日期是在 ParquetSerde 中使用 HIVE-8119 和 Hive 1.2 实现的。