使用模式文件创建一个 Parquet 支持的 Hive table

create a Parquet backed Hive table by using a schema file

Cloudera documentation, shows a simple way to "create a Avro backed Hive table by using an Avro schema file." This works great. I would like to do the same thing for a Parquet backed Hive table, but the relevant documentation 在这种情况下列出了每个列类型,而不是从模式中读取。是否有可能以与 Avro 数据相同的方式从模式中读取 Parquet 列?

目前,答案似乎是。 Hive 有一个未解决的问题。 https://issues.apache.org/jira/browse/PARQUET-76

这个问题最近很活跃,所以希望 Hive 在不久的将来为 Parquet 提供与 Avro 相同的功能。