如何从 Hive 的字段中去除美元符号 ($)?
How can I strip dollar signs ($) from a field in Hive?
我正在尝试将 csv 导入 Hive。我有一列是美元值,在 CSV 中报告为“123,244.00 美元”。我想将此值转换为 Hive 中的浮点数。
所以我已将 csv 加载到临时 table 中,将该列视为字符串。接下来我想将它加载到最终的 table 中,并在此过程中将该字符串转换为浮点数或小数。
关于执行此操作的最佳方法有什么建议吗?
这应该有效:
select float(regexp_replace(substr('3,244.00', 2, length('3,244.00')), ',', '')) from table;
您需要删除所有逗号和美元符号。您可能会发现此 link 也有帮助:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Types#LanguageManualTypes-NumericTypes
我正在尝试将 csv 导入 Hive。我有一列是美元值,在 CSV 中报告为“123,244.00 美元”。我想将此值转换为 Hive 中的浮点数。
所以我已将 csv 加载到临时 table 中,将该列视为字符串。接下来我想将它加载到最终的 table 中,并在此过程中将该字符串转换为浮点数或小数。
关于执行此操作的最佳方法有什么建议吗?
这应该有效:
select float(regexp_replace(substr('3,244.00', 2, length('3,244.00')), ',', '')) from table;
您需要删除所有逗号和美元符号。您可能会发现此 link 也有帮助:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Types#LanguageManualTypes-NumericTypes