Python UDF - import/read 外部文件
Python UDF - import/read external files
我想将其他 python/csv 文件导入我的 python udf 以执行一些操作。
喜欢,
将 table 数据(作为流逐行流入)与外部 .csv 行进行比较。
当我尝试读取 .csv 文件的数据时,出现错误
IOError: File /home/abc/xyz/myfile.csv does not exist
虽然代码作为常规 python 脚本(不像 udf)编写时运行良好
如果我没理解错的话。你可以试试
添加文件 [您的完整文件路径]
要么
添加文件 [您的目录路径].
因为在引用集群上的任何内容之前,您必须将其添加到分发缓存中,以便那里的代码可以访问该部分。
你可以看看它。
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Cli
注意语法!它可能会导致很多问题,不幸的是,查询语言解释器无法显示问题的来源,它只会显示一些一般性错误报告。
在此处查看由寻址文件时的语法问题引起的相同问题!
我想将其他 python/csv 文件导入我的 python udf 以执行一些操作。
喜欢,
将 table 数据(作为流逐行流入)与外部 .csv 行进行比较。
当我尝试读取 .csv 文件的数据时,出现错误
IOError: File /home/abc/xyz/myfile.csv does not exist
虽然代码作为常规 python 脚本(不像 udf)编写时运行良好
如果我没理解错的话。你可以试试 添加文件 [您的完整文件路径] 要么 添加文件 [您的目录路径].
因为在引用集群上的任何内容之前,您必须将其添加到分发缓存中,以便那里的代码可以访问该部分。 你可以看看它。 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Cli
注意语法!它可能会导致很多问题,不幸的是,查询语言解释器无法显示问题的来源,它只会显示一些一般性错误报告。
在此处查看由寻址文件时的语法问题引起的相同问题!