Python UDF - import/read 外部文件

Python UDF - import/read external files

我想将其他 python/csv 文件导入我的 python udf 以执行一些操作。
喜欢,
将 table 数据(作为流逐行流入)与外部 .csv 行进行比较。
当我尝试读取 .csv 文件的数据时,出现错误

IOError: File /home/abc/xyz/myfile.csv does not exist

虽然代码作为常规 python 脚本(不像 udf)编写时运行良好

如果我没理解错的话。你可以试试 添加文件 [您的完整文件路径] 要么 添加文件 [您的目录路径].

因为在引用集群上的任何内容之前,您必须将其添加到分发缓存中,以便那里的代码可以访问该部分。 你可以看看它。 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Cli

注意语法!它可能会导致很多问题,不幸的是,查询语言解释器无法显示问题的来源,它只会显示一些一般性错误报告。

在此处查看由寻址文件时的语法问题引起的相同问题!