使用 csv-serde 时自动选择定界符
Auto selected delimiter while using csv-serde
已创建 table 使用:
)
ROW FORMAT SERDE 'com.bizo.hive.serde.csv.CSVSerde'
with serdeproperties(
"field.delim"="|"
)
当我尝试上传以逗号分隔的文件时,它已正确上传。如果我将管道配置为数据的分隔符,这怎么可能? csv-Serde 是否有一些 "smart" 识别分隔符的方法?
根据 documentation 有效的 CSVSerde 属性是
"separatorChar" = "\t",
"quoteChar" = "'",
"escapeChar" = "\"
默认分隔符、引号和转义字符(如果未指定)
DEFAULT_ESCAPE_CHARACTER \
DEFAULT_QUOTE_CHARACTER "
DEFAULT_SEPARATOR ,
不支持 field.delim
属性 将被忽略并使用默认设置。
此 属性 对另一个 SerDe MultiDelimitSerDe
有效
已创建 table 使用:
)
ROW FORMAT SERDE 'com.bizo.hive.serde.csv.CSVSerde'
with serdeproperties(
"field.delim"="|"
)
当我尝试上传以逗号分隔的文件时,它已正确上传。如果我将管道配置为数据的分隔符,这怎么可能? csv-Serde 是否有一些 "smart" 识别分隔符的方法?
根据 documentation 有效的 CSVSerde 属性是
"separatorChar" = "\t",
"quoteChar" = "'",
"escapeChar" = "\"
默认分隔符、引号和转义字符(如果未指定)
DEFAULT_ESCAPE_CHARACTER \
DEFAULT_QUOTE_CHARACTER "
DEFAULT_SEPARATOR ,
不支持 field.delim
属性 将被忽略并使用默认设置。
此 属性 对另一个 SerDe MultiDelimitSerDe