如何在由“^P”分隔符分隔的数据上构建配置单元 table
How to build a hive table on data which is separated by '^P' delimiter
我的查询是:
CREATE EXTERNAL TABLE gateway_staging (
poll int,
total int,
transaction_id int,
create_time timestamp,
update_time timestamp
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '^P';
(我不确定'^P'是否可以用作分隔符但尝试了一下)
当我将数据加载到配置单元 table 时,结果显示所有字段 'none'。
数据看起来像:
4307421698^P200^P138193920770^P2017-03-08 02:46:18.021204^P2017-03-08
02:46:18.021204
请帮帮我。
^P
的八进制值为020
。试试,
CREATE EXTERNAL TABLE gateway_staging (
poll int,
total int,
transaction_id int,
create_time timestamp,
update_time timestamp
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '0';
选项如下:
... fields terminated by '0'
(八进制)
... fields terminated by '16'
(十进制)
... fields terminated by '\u0010'
(十六进制)
请注意,有一个与 Unicode 文字 ('\u0010') 相关的错误应该会在 2.1 版中修复,因此使用第三个选项将无法在早期版本中使用。
https://issues.apache.org/jira/browse/HIVE-13434
我的查询是:
CREATE EXTERNAL TABLE gateway_staging (
poll int,
total int,
transaction_id int,
create_time timestamp,
update_time timestamp
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '^P';
(我不确定'^P'是否可以用作分隔符但尝试了一下)
当我将数据加载到配置单元 table 时,结果显示所有字段 'none'。
数据看起来像:
4307421698^P200^P138193920770^P2017-03-08 02:46:18.021204^P2017-03-08 02:46:18.021204
请帮帮我。
^P
的八进制值为020
。试试,
CREATE EXTERNAL TABLE gateway_staging (
poll int,
total int,
transaction_id int,
create_time timestamp,
update_time timestamp
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '0';
选项如下:
... fields terminated by '0'
(八进制)... fields terminated by '16'
(十进制)... fields terminated by '\u0010'
(十六进制)
请注意,有一个与 Unicode 文字 ('\u0010') 相关的错误应该会在 2.1 版中修复,因此使用第三个选项将无法在早期版本中使用。 https://issues.apache.org/jira/browse/HIVE-13434