Java UDF on Hadoop 输入参数 -- 从 Pig on Hadoop 调用

Java UDF on Hadoop input parameter -- call from Pig on Hadoop

如果我在 Pig 中有以下数据结构(一个关系)并且我想将它传递给一个 Java UDF,想知道输入参数的相关 Java 数据类型应该是什么?

(学生关系是一个包,schema 是 int 的 ID,一个元组包含一个兴趣包和一个 类 包)。

student: {id: int,(interest: {(value: chararray)},classes: {(value: chararray)})}

提前致谢, 林

我觉得可以按照下图来做。

 public class BagUdf extends EvalFunc<DataBag> {

public <returnType> exec(Tuple input) throws IOException {
//iterate over the bag elements
for (Tuple t : (DataBag)input.get(0)) {
     // process tuple t
}
return returnVal;
}

请参考这个link