Apache pig 如何在执行连接操作时 select 来自一个关系的所有列
Apache pig How to select all columns from one relation when performing a join operation
假设我有两个关系:
关系 1:
Col1......Col100, id
关系 2:
R2Col1, R2Col2, R2Col3, id
现在我正在尝试做类似的事情:
Relation3 = Join Relation 1 BY id, Relation2 BY id USING 'replicated';
在这种情况下,relation3 将变为:
关系3:
Col1......Col100, id, R2Col1, R2Col2, R2Col3, id
我想知道是否有办法仅从关系 1 中获取 select 列。列很多,因此对它们进行硬编码并不理想。理想情况下,我正在寻找与 SQL 中的 SELECT relation1.*
等效的东西。非常感谢!
是的,您可以使用带 ..
的位置符号来获取关系 1 中的所有字段。[=12=]..
表示从第一个字段 $0 开始生成所有字段。见,我回答过类似的问题。
relation4 = foreach relation3 generate relation1::[=10=]..;
假设我有两个关系:
关系 1:
Col1......Col100, id
关系 2:
R2Col1, R2Col2, R2Col3, id
现在我正在尝试做类似的事情:
Relation3 = Join Relation 1 BY id, Relation2 BY id USING 'replicated';
在这种情况下,relation3 将变为: 关系3:
Col1......Col100, id, R2Col1, R2Col2, R2Col3, id
我想知道是否有办法仅从关系 1 中获取 select 列。列很多,因此对它们进行硬编码并不理想。理想情况下,我正在寻找与 SQL 中的 SELECT relation1.*
等效的东西。非常感谢!
是的,您可以使用带 ..
的位置符号来获取关系 1 中的所有字段。[=12=]..
表示从第一个字段 $0 开始生成所有字段。见
relation4 = foreach relation3 generate relation1::[=10=]..;