如何删除 aws athena table 中的不间断空格?

How can I remove non-breaking spaces in my aws athena table?

我将时间戳存储为字符串 [从 csv 导入]。 字符串:2022-05-04[NBSP]02:46:35

实际字符串:2022-05-04 02:46:35

中间的 space 是一个不间断的 space 并防止转换为时间戳。

我试过了

UPDATE mytable
SET myts = REPLACE(myts, CHR('00A0'), '')

我在 AWS 控制台的 datagrip 和 athena 编辑器中收到一条错误消息,提示我正在使用的连接器不支持更新。

我想将其转换为常规 space 以便转换为时间戳。

虽然无法完成更新,但可以在现有 table 之上创建新视图并在下游引用。替换 myts = REPLACE(myts, CHR('00A0'), '') 的语法将完全删除 space——要获得所需的格式转换为时间戳,它应该是

myts = REPLACE(myts, CHR('00A0'), ' ')

如果数据量很大,直到后来被过滤的时候,对每个清理操作进行具体化是低效的,最好使用视图而不是使用 CTAS 进行具体化。