Hive table(orc 类型)指向的 ORC 文件是否应该包含 hive table 中的所有属性?

Should ORC files pointed by a Hive table (orc type) contain all the attributes in the hive table?

我有一个指向包含多个 orc 文件的 s3 路径 (s3:///table/data/) 的配置单元 table。 我有一份将文件写入上述前缀的工作,但是,不能保证属性的顺序(在文件中)并且并非所有属性都被填充,即某些文件可能只有数据的子集。

那么,hive table 可以使用适当的列名称映射列数据,并 return 为查询的每个列映射适当的值吗?

No incase of ORC table 只是根据 [=33= 中列的顺序读取数据].

如果属性顺序无法保证,那么hive orc table 根据[=33=读取数据 ] schema 如果数据类型匹配则 显示值 (或) 将值转换为该类型 (或)null.

可能您需要 Create an AVRO table 然后基于 avro 架构 table 将指向正确的值。