teradata connector sqoop sequencefile 格式能否克服分隔符问题？

Question

如果数据库的字段中包含诸如“,”和“\n”之类的字段，是否可以使用 sqoop 到 hive 而无需修复这些分隔符，可能使用替代格式而不是标准文本文件？一直在使用一些解决方法（即/替换分隔符、oreplace 等）。

Answer 1

我找到的基于列的换行符解决此问题的解决方案：

SELECT 
  COL_A,
  OREPLACE(COL_B, '0A'XC, '_replace_char_'),
  ...,
  COL_N
FROM
  TABLE_NAME

假设这也适用于逗号。我还没有测试你是否可以嵌套这个 replace char 语句。还没有估计对 spool-space 使用的影响。

答案在第一个问题里，不在'answers':

Can the teradata connector sqoop sequencefile format overcome delimiter issues?