MLFlow sklearn autologging 在 colab 中打印了太多信息消息

MLFlow sklearn autologging prints too many info messages in colab

我正在尝试 mlflow sklearn 自动记录,在 colab 中,mlflow 会打印很多信息消息,有时它会使浏览器崩溃。附上信息日志图片

代码在 this colab file

我不确定这里缺少什么,但相同的代码可以正常工作,而无需在我的本地计算机上生成这些信息日志。

这是 MLFlow 包的一个已知问题,已在其中提出了修补程序。

看这里:https://github.com/mlflow/mlflow/pull/3978

故障描述

在 MLflow 1.13.0 和 1.13.1 中,当修补的 ML 训练函数开始在预先存在的 MLflow 运行.

中执行时,会发出以下 Python 事件日志消息

不幸的是,对于 child 调用其他补丁 ML 训练例程的补丁 ML 训练例程(例如,sklearn 随机森林在 sklearn DecisionTree 实例集合上调用 fit() ),打印此事件日志每次调用 child 时输出到标准输出。

这会产生数百个对用户没有价值的冗余事件日志记录调用。