如何在由“^P”分隔符分隔的数据上构建配置单元 table

How to build a hive table on data which is separated by '^P' delimiter

我的查询是:

CREATE EXTERNAL TABLE gateway_staging (
  poll int,
  total int,
  transaction_id int,
  create_time timestamp,
  update_time timestamp
  )
  ROW FORMAT DELIMITED FIELDS TERMINATED BY '^P';

(我不确定'^P'是否可以用作分隔符但尝试了一下)

当我将数据加载到配置单元 table 时,结果显示所有字段 'none'。

数据看起来像:

4307421698^P200^P138193920770^P2017-03-08 02:46:18.021204^P2017-03-08 02:46:18.021204

请帮帮我。

^P的八进制值为020。试试,

CREATE EXTERNAL TABLE gateway_staging (
  poll int,
  total int,
  transaction_id int,
  create_time timestamp,
  update_time timestamp
  )
  ROW FORMAT DELIMITED FIELDS TERMINATED BY '0';

选项如下:

  • ... fields terminated by '0'(八进制)
  • ... fields terminated by '16'(十进制)
  • ... fields terminated by '\u0010'(十六进制)

请注意,有一个与 Unicode 文字 ('\u0010') 相关的错误应该会在 2.1 版中修复,因此使用第三个选项将无法在早期版本中使用。 https://issues.apache.org/jira/browse/HIVE-13434