根据更新的数据集自动重新训练分类模型

Retrain the classification model automatically based on updated data set

我们在 Azure ML Studio 中创建了一个实验,以根据系统数据和用户数据预测一些调度活动。系统数据由 CPU 时间、堆使用情况和其他系统参数组成,而用户数据包含用户的活动会话和一些用户特定的数据。 我们的实验运行良好,返回的结果与我们的预期非常相似,但我们正在努力解决以下问题:-

1) 我们的实验没有考虑更新数据来训练它的模型。

2) 每次我们都需要手动上传数据和重新训练模型。

我想知道是否真的可以使用某些 Web 服务或使用 Azure DB 将实时数据输入到 Azure 实验中。我们正在尝试更新我们在 Azure 存储中创建的 CSV 文件中的数据。这可能会解决我们的第一个查询。

现在,应该考虑使用这个更新的数据来定期自动训练模型。

如果有人能帮助我们解决这个问题就好了?

注意:我们使用我们的模型使用在 Azure 工作室的帮助下创建的 Web 服务。

您需要使用 Azure 数据工厂重新训练 ML 模型。

您需要使用 ML 批量执行和 ML 更新资源活动创建管道,并调用您的 ML 模型,您需要在 web 服务上配置端点。

这里有一些链接可以帮助您:

https://docs.microsoft.com/en-us/azure/data-factory/transform-data-using-machine-learning

https://docs.microsoft.com/en-us/azure/data-factory/update-machine-learning-models

第 1 步:使用 Azure ML Studio 创建 2 个 Web 服务(一个用于训练模型,一个用于预测模型)

步骤 2:使用 link 在 Azure ML Studio 上为每个 Web 服务管理端点

通过 Web 服务创建端点

第 3 步:在 Azure 数据工厂上创建 2 个新连接/找到 Azure ML(在计算选项卡上)并复制端点密钥和 API 您将在端点配置的“使用”选项卡下找到的密钥(您在步骤 2) 中创建的那个端点密钥 = 批处理请求密钥和 API 密钥 = 主密钥

为训练模型端点设置禁用更新资源 为预测模型端点设置启用更新资源(更新资源端点 = 补丁密钥)

第 4 步:创建包含 2 个活动的管道(ML 批处理执行和 ML 更新资源) 使用已禁用更新资源的连接为 ML 批处理执行设置 AML 链接服务

使用启用更新资源的连接为 ML 更新资源设置 AML 链接服务

第 5 步:设置 Web 服务输入和输出