蜂巢长度输出比看到的更多
Hive Length outputs more than seen
我正在尝试 运行 一个配置单元查询,它应该将两个 table 与匹配的记录连接起来。但是,它永远不会匹配,但我在另一个 table 中有记录。当我计算给定字符串的长度时,它输出 27,但它应该只是 12。
当我从 s3 下载输出文件时,我看到像
这样的奇怪行
U S 3 F F 1 2 1 4 9 3 3
但在 Hive 控制台中它将其视为
US3FF1214933
我也无法查询
的行
select * from table where item like "US3FF1214933";
现在完全是一团糟,修剪对我来说也不起作用。
我需要帮助。
提前致谢,
感谢 legato 给了我一个想法来调查这个
od -c 并查看字符串之间的实际字符。
然后在配置单元查询中使用 regexp_replace(ExString,'\0',"") 将奇怪的字符替换为空字符串解决了我的问题。
我正在尝试 运行 一个配置单元查询,它应该将两个 table 与匹配的记录连接起来。但是,它永远不会匹配,但我在另一个 table 中有记录。当我计算给定字符串的长度时,它输出 27,但它应该只是 12。 当我从 s3 下载输出文件时,我看到像
这样的奇怪行U S 3 F F 1 2 1 4 9 3 3
但在 Hive 控制台中它将其视为
US3FF1214933
我也无法查询
的行select * from table where item like "US3FF1214933";
现在完全是一团糟,修剪对我来说也不起作用。 我需要帮助。
提前致谢,
感谢 legato 给了我一个想法来调查这个 od -c 并查看字符串之间的实际字符。
然后在配置单元查询中使用 regexp_replace(ExString,'\0',"") 将奇怪的字符替换为空字符串解决了我的问题。