teradata connector sqoop sequencefile 格式能否克服分隔符问题?
Can the teradata connector sqoop sequencefile format overcome delimiter issues?
如果数据库的字段中包含诸如“,”和“\n”之类的字段,是否可以使用 sqoop 到 hive 而无需修复这些分隔符,可能使用替代格式而不是标准文本文件?一直在使用一些解决方法(即/替换分隔符、oreplace 等)。
我找到的基于列的换行符解决此问题的解决方案:
SELECT
COL_A,
OREPLACE(COL_B, '0A'XC, '_replace_char_'),
...,
COL_N
FROM
TABLE_NAME
假设这也适用于逗号。我还没有测试你是否可以嵌套这个 replace char 语句。还没有估计对 spool-space 使用的影响。
答案在第一个问题里,不在'answers':
https://community.teradata.com/t5/Database/Removing-a-line-break-character-in-a-column/td-p/52431
如果数据库的字段中包含诸如“,”和“\n”之类的字段,是否可以使用 sqoop 到 hive 而无需修复这些分隔符,可能使用替代格式而不是标准文本文件?一直在使用一些解决方法(即/替换分隔符、oreplace 等)。
我找到的基于列的换行符解决此问题的解决方案:
SELECT
COL_A,
OREPLACE(COL_B, '0A'XC, '_replace_char_'),
...,
COL_N
FROM
TABLE_NAME
假设这也适用于逗号。我还没有测试你是否可以嵌套这个 replace char 语句。还没有估计对 spool-space 使用的影响。
答案在第一个问题里,不在'answers':
https://community.teradata.com/t5/Database/Removing-a-line-break-character-in-a-column/td-p/52431