PyFlink 可以和 PyTorch/Tensorflow/ScikitLearn/Xgboost/LightGBM 一起使用吗?

Can I use PyFlink together with PyTorch/Tensorflow/ScikitLearn/Xgboost/LightGBM?

我正在探索 PyFlink,我想知道是否可以将 PyFlink 与 ML 工程师通常使用的所有这些 ML 库一起使用:PyTorch、Tensorflow、Scikit Learn、Xgboost、LightGBM 等

根据this SO thread,PySpark 不能直接在 UDF 内部使用 Scikit Learn,因为 Scikit Learn 算法不是分布式实现的,而 Spark 是分布式运行的。

鉴于 PyFlink 与 PySpark 相似,我想答案可能是“否”。但我想仔细检查一下,看看我需要做什么才能使 PyFlink 能够使用这些 ML 库定义 UDF。

感谢您调查 PyFlink 以及所有这些 ML 库。 IMO,你可以参考支持 Flink 上的 Tensorflow、Flink 上的 PyTorch 等的 flink-ai-extended 项目,其存储库 url 是 https://github.com/alibaba/flink-ai-extended。 Flink AI Extended 是一个将 Flink 扩展到各种机器学习场景的项目,可以和 PyFlink 一起使用。也可以扫描README文件中涉及的二维码加入群