HIVE:应用定界符直到指定的列

HIVE: apply delimiter until a specified column

我正在尝试将数据从文件移动到配置单元 table。文件中的数据看起来像这样:-

StringA StringB StringC StringD StringE

其中每个字符串由 space 分隔。问题是我想要单独的列用于 StringA、StringB 和 StringC,而一列用于 StringD,即 StringD 和 String E 应该属于同一列。如果我使用 ROW DELIMITED BY FIELDS TERMINATED BY ' ',Hive 将为 StringD 和 StringE 生成单独的列。 (StringD 和 StringE 本身包含 space 而其他字符串本身不包含 space)

hive 中是否有任何特殊语法来实现此目的,或者我是否需要以某种方式预处理我的数据文件?

使用正则表达式 https://cwiki.apache.org/confluence/display/Hive/GettingStarted#GettingStarted-ApacheWeblogData 您可以定义何时使用 space 作为分隔符以及何时使用部分数据