如何使用 SFTP input/output Google 数据流
How to input/output Google Dataflow with SFTP
在演示中,源代码使用 google 存储。
但是如何用SFTP替换呢?
您可以使用 pysftp 下载数据并将其保存到 Beam 管道外的 GCS 存储桶中。然后启动指向 GCS bucket 的光束流水线。由于您的工作流程本质上是分批处理的,所以这样就可以了。梁中没有 FTP 个连接器。
在演示中,源代码使用 google 存储。 但是如何用SFTP替换呢?
您可以使用 pysftp 下载数据并将其保存到 Beam 管道外的 GCS 存储桶中。然后启动指向 GCS bucket 的光束流水线。由于您的工作流程本质上是分批处理的,所以这样就可以了。梁中没有 FTP 个连接器。