是否可以将不同的子类传递给同一个 PCollection?
Is it possible to pass different subclasses to the same PCollection?
是否可以在 Beam 中拥有一个 PCollection "holds" 同一超类的不同对象,使得
PCollection<T extends SuperClass> result = input.apply(ParDo.of(new DoFnThatReturnsSubClasses()));
而不是
PCollection<SubClassA> A = input.apply(ParDo.of(new DoFnSubClassesA()));
PCollection<SubClassB> B = input.apply(ParDo.of(new DoFnSubClassesB()));
我的超类包含一些基本字段,如下所示
public class SuperClass {
String key;
Long timestamp;
}
但是我的子类将包含一个附加字段,该字段具有不同数据类型的相同变量名。即
public class SubClassA extends SuperClass {
List<HashMap<String, String>> value = new ArrayList<>();
}
另一个子类,
public class SubClassB extends SuperClass {
String value;
}
我真正想要实现的是让字段value
可以是不同的数据类型。我唯一能想到的就是把它分成不同的子类。我意识到这可能更像是一个 Java 编程问题和对语言的理解不足。
是的,这是可能的。您可以拥有一个包含 SubclassX 对象混合的 PCollection。您需要确保您用于 PCollection 的 Coder 可以编码和解码所有可能的子类。
您的 DoFns 下游将接收超类对象,您需要向下转型到适当的子类。
是否可以在 Beam 中拥有一个 PCollection "holds" 同一超类的不同对象,使得
PCollection<T extends SuperClass> result = input.apply(ParDo.of(new DoFnThatReturnsSubClasses()));
而不是
PCollection<SubClassA> A = input.apply(ParDo.of(new DoFnSubClassesA()));
PCollection<SubClassB> B = input.apply(ParDo.of(new DoFnSubClassesB()));
我的超类包含一些基本字段,如下所示
public class SuperClass {
String key;
Long timestamp;
}
但是我的子类将包含一个附加字段,该字段具有不同数据类型的相同变量名。即
public class SubClassA extends SuperClass {
List<HashMap<String, String>> value = new ArrayList<>();
}
另一个子类,
public class SubClassB extends SuperClass {
String value;
}
我真正想要实现的是让字段value
可以是不同的数据类型。我唯一能想到的就是把它分成不同的子类。我意识到这可能更像是一个 Java 编程问题和对语言的理解不足。
是的,这是可能的。您可以拥有一个包含 SubclassX 对象混合的 PCollection。您需要确保您用于 PCollection 的 Coder 可以编码和解码所有可能的子类。
您的 DoFns 下游将接收超类对象,您需要向下转型到适当的子类。