使用 csv-serde 时自动选择定界符

Auto selected delimiter while using csv-serde

已创建 table 使用:

 )   
ROW FORMAT SERDE 'com.bizo.hive.serde.csv.CSVSerde'
with serdeproperties(
"field.delim"="|"
)   

当我尝试上传以逗号分隔的文件时,它已正确上传。如果我将管道配置为数据的分隔符,这怎么可能? csv-Serde 是否有一些 "smart" 识别分隔符的方法?

根据 documentation 有效的 CSVSerde 属性是

   "separatorChar" = "\t",
   "quoteChar"     = "'",
   "escapeChar"    = "\"

默认分隔符、引号和转义字符(如果未指定)

DEFAULT_ESCAPE_CHARACTER \
DEFAULT_QUOTE_CHARACTER  "
DEFAULT_SEPARATOR        ,
不支持

field.delim 属性 将被忽略并使用默认设置。 此 属性 对另一个 SerDe MultiDelimitSerDe

有效