Hive UDTF 不接受超过 2 列的输出

Hive UDTF not accepting more than 2 columns output

我编写的配置单元 UDTF 在指定的输出列数为两个时工作正常。但是现在,我将其更改为三个并重新部署,它显示以下错误消息。

FAILED: SemanticException [错误 10083]: AS 子句中提供的别名数与 UDTF 输出的列数不匹配,预期 2 个别名但得到 3 个

有什么理由吗?

这是我在初始化方法中使用的代码块。

List<String> fieldNames = new ArrayList<String>(3);
List<ObjectInspector> fieldOIs = new ArrayList<ObjectInspector>(3);
fieldNames.add("word");
fieldNames.add("cnt");
fieldNames.add("ext");

fieldOIs.add(PrimitiveObjectInspectorFactory.javaStringObjectInspector);
fieldOIs.add(PrimitiveObjectInspectorFactory.javaIntObjectInspector);
fieldOIs.add(PrimitiveObjectInspectorFactory.javaIntObjectInspector);

return ObjectInspectorFactory.getStandardStructObjectInspector(fieldNames, fieldOIs);

这是处理方法中的前向语句

forward(new Object[] { "abcdef", Integer.valueOf(123), Integer.valueOf(123)});

感谢任何帮助。

解决方案是关闭当前的 Hive CLI 会话,打开另一个 Hive 会话并部署 jar 以使 initialize() 中的新更改生效。

要使更改生效,

initialize() 方法 --> 重新启动一个新的 Hive CLI 会话并重新部署 jar

process() 方法 --> 在同一会话中重新部署 jar 有效!

似乎仅在首次部署 jar 期间每个会话加载 initialize() 方法,而每次在同一会话中重新部署 jar 时都会重新加载 process() 方法。

由于有关列数的信息存在于 initialize() 方法中,因此它不适用于同一会话中的任何数量的重新部署。当我关闭会话并在部署 jar 文件之前启动一个新会话时,它起作用了。