MLflow:为什么 backend-store-uri 不能是 s3 位置?

MLflow: Why can't backend-store-uri be an s3 location?

我是 mlflow 的新手,我不明白为什么 artifact store 不能与 backend store 相同?

我能想到的唯一原因是能够使用 SQL 语法查询实验...但是因为我们可以使用 mlflow ui 与运行交互 我只是不明白为什么所有工件和参数不能到达同一位置(使用本地存储时会发生这种情况)。

任何人都可以阐明这一点吗?

MLflow 的工件通常是 ML 模型,即相对较大的二进制文件。另一方面,运行 数据通常是几个浮点数。

归根结底不是什么可以或不可以的问题(很多事情只要你付出足够的努力就可以),而是要遵循好的做法:

  • 在 SQL 数据库中存储大型二进制工件是可能的,但迟早会降低数据库的性能,这反过来又会降低您的用户体验。
  • 从 SQL 数据库中存储几个浮点数以便在前端或通过命令行快速检索显示是经过行业验证的可靠经典方法

MLflow 关于架构设计原理的文档仍然可以改进(截至 2020 年)