在 polybase 中使用 unicode 字段终止符
Use unicode field terminator in polybase
在为存储在 Azure blob 存储中的外部数据创建 PolyBase 外部文件格式定义时,我很难将字段终止符指定为 unicode 字符。
我之所以要指定 unicode 字符,是因为当我使用 Azure 数据工厂在 azure blob 中加载数据时,copy activity 不支持指定多个字符作为列分隔符,除非它是一个 unicode 字符,例如 \u0081
查看文档 here,它建议自定义分隔符是可能的,但使用它们的十六进制代码:
STRING_DELIMITER = '0x22' -- Double quote hex
STRING_DELIMITER = '0x7E0x7E' -- Two tildas (e.g. ~~)
对于您的示例,您可以尝试(未经测试):
STRING_DELIMITER = '0x81' -- Control character \u0081
在为存储在 Azure blob 存储中的外部数据创建 PolyBase 外部文件格式定义时,我很难将字段终止符指定为 unicode 字符。 我之所以要指定 unicode 字符,是因为当我使用 Azure 数据工厂在 azure blob 中加载数据时,copy activity 不支持指定多个字符作为列分隔符,除非它是一个 unicode 字符,例如 \u0081
查看文档 here,它建议自定义分隔符是可能的,但使用它们的十六进制代码:
STRING_DELIMITER = '0x22' -- Double quote hex
STRING_DELIMITER = '0x7E0x7E' -- Two tildas (e.g. ~~)
对于您的示例,您可以尝试(未经测试):
STRING_DELIMITER = '0x81' -- Control character \u0081