是否可以将不同的子类传递给同一个 PCollection?

Is it possible to pass different subclasses to the same PCollection?

是否可以在 Beam 中拥有一个 PCollection "holds" 同一超类的不同对象,使得

PCollection<T extends SuperClass> result =  input.apply(ParDo.of(new DoFnThatReturnsSubClasses()));

而不是

PCollection<SubClassA> A = input.apply(ParDo.of(new DoFnSubClassesA()));
PCollection<SubClassB> B = input.apply(ParDo.of(new DoFnSubClassesB()));

我的超类包含一些基本字段,如下所示

public class SuperClass {

String key; 
Long timestamp;

}

但是我的子类将包含一个附加字段,该字段具有不同数据类型的相同变量名。即

public class SubClassA extends SuperClass {   
    List<HashMap<String, String>> value = new ArrayList<>();       
}

另一个子类,

public class SubClassB extends SuperClass {   
    String value;       
}

我真正想要实现的是让字段value可以是不同的数据类型。我唯一能想到的就是把它分成不同的子类。我意识到这可能更像是一个 Java 编程问题和对语言的理解不足。

是的,这是可能的。您可以拥有一个包含 SubclassX 对象混合的 PCollection。您需要确保您用于 PCollection 的 Coder 可以编码和解码所有可能的子类。

您的 DoFns 下游将接收超类对象,您需要向下转型到适当的子类。