模型 i ML.NET 的分布式训练?

Distributed training of a model i ML.NET?

是否可以将 ML.NET 中的一个模型分布 training/fit 到多个 workers/servers?我得到了大量的记录,其中包含多达 10 个或更多的特征,我想重新训练这些特征,但是在一台计算机上需要很长时间才能完成。

ML.NET 目前没有内置的方式来分发训练。尽管如果它是您想要在框架中拥有的东西,您可以在 dotnet/machinelearning repo.

中创建一个问题

您是否尝试过在一台 PC 上进行训练?我问的原因是因为 ML.NET 适用于大型数据集,因此在单台机器上进行训练可能足以满足您的场景。

根据您要训练的模型类型,另一种选择是拆分您的数据并在各自的数据拆分上训练不同的模型。然后,获取各个模型的权重/模型参数,并创建一个对它们进行平均的模型。我不认为所有模型都会为您提供它们的权重/模型参数,但这里有一些模型可以提供,以及您如何提取它们的权重/模型参数。

https://docs.microsoft.com/dotnet/machine-learning/how-to-guides/retrain-model-ml-net