蜂巢长度输出比看到的更多

Hive Length outputs more than seen

我正在尝试 运行 一个配置单元查询,它应该将两个 table 与匹配的记录连接起来。但是,它永远不会匹配,但我在另一个 table 中有记录。当我计算给定字符串的长度时,它输出 27,但它应该只是 12。 当我从 s3 下载输出文件时,我看到像

这样的奇怪行

U S 3 F F 1 2 1 4 9 3 3

但在 Hive 控制台中它将其视为

US3FF1214933

我也无法查询

的行

select * from table where item like "US3FF1214933";

现在完全是一团糟,修剪对我来说也不起作用。 我需要帮助。

提前致谢,

感谢 legato 给了我一个想法来调查这个 od -c 并查看字符串之间的实际字符。

然后在配置单元查询中使用 regexp_replace(ExString,'\0',"") 将奇怪的字符替换为空字符串解决了我的问题。