使用控制文件上传 tsv 文件未检测到空列
tsv file upload using control file not detect empty columns
我有一个类似于下面的控制文件。
load data
infile 'input.tsv'
badfile 'inputbad.bad'
discardfile 'inputdiscard.dsc'
truncate
into table SIM_RCNC_TO_POSTALCODE
fields terminated by '\t'
OPTIONALLY ENCLOSED BY '"' AND '"'
trailing nullcols
( col1 CHAR(4000),
col2 CHAR(4000),
col3 CHAR(4000),
col4 CHAR(4000),
col5 CHAR(4000)
)
下面是input.tsv内容
670535 535 text 1 7244
670536 536 text 1 text 2 7244
它在第一行包含 "text 1" 和 7244 之间的 2 个制表符。但它将插入到 table 如下所示。
col1 col2 col3 clo4 col5
670535 535 text 1 7244
670536 536 text 1 text 2 7244
第 1 行不正确,第 2 行正确。有人可以向我解释一下这个问题吗?
删除行:(可选地由“”和“””括起来)。当字符是 TAB 时,它似乎与 "fields terminated by '\t'" 行不兼容。
刚刚偶然发现了一些信息:http://technologydribble.info/2008/11/12/sqlloader-and-tab-delimited-input-data/
我有一个类似于下面的控制文件。
load data
infile 'input.tsv'
badfile 'inputbad.bad'
discardfile 'inputdiscard.dsc'
truncate
into table SIM_RCNC_TO_POSTALCODE
fields terminated by '\t'
OPTIONALLY ENCLOSED BY '"' AND '"'
trailing nullcols
( col1 CHAR(4000),
col2 CHAR(4000),
col3 CHAR(4000),
col4 CHAR(4000),
col5 CHAR(4000)
)
下面是input.tsv内容
670535 535 text 1 7244
670536 536 text 1 text 2 7244
它在第一行包含 "text 1" 和 7244 之间的 2 个制表符。但它将插入到 table 如下所示。
col1 col2 col3 clo4 col5
670535 535 text 1 7244
670536 536 text 1 text 2 7244
第 1 行不正确,第 2 行正确。有人可以向我解释一下这个问题吗?
删除行:(可选地由“”和“””括起来)。当字符是 TAB 时,它似乎与 "fields terminated by '\t'" 行不兼容。
刚刚偶然发现了一些信息:http://technologydribble.info/2008/11/12/sqlloader-and-tab-delimited-input-data/