定义 Apache Beam 管道时管道后的字符串表示什么?

What does a string after pipe while defining an Apache beam pipeline signifies?

lines = pipeline | 'ReadFromText' >> beam.io.ReadFromText(
    'path/to/input-*.csv')

上面代码中的字符串'ReadFromText'有什么意义?

竖线 | 后的字符串是命名步骤的可选方式,它可以命名为任何不一定与 beam.io.

的名称匹配的名称

上面的代码也可以不命名步骤写成如下:

lines = pipeline | beam.io.ReadFromText(
    'path/to/input-*.csv')

重定向键 >> 仅在命名步骤时使用。