我可以使用逻辑回归算法根据历史数据预测给定任务的预计到达时间吗?
Can I use logistic regression algorithm to predict an ETA for a given task based on historical data?
我可以使用逻辑回归算法根据历史数据预测给定任务的预计到达时间吗?我有一些任务需要花费不同的时间,具体取决于任务类型、天气、季节、请求时间等几个因素。
今天,我们根据 mysql 商店中的任务类型捕获所有任务所花费的时间。现在我们想要添加一个基于因素和任务类型的功能,我们想要预测任务的 ETA 并将其显示给客户。
我们打算用Spark,用Logistic Regression和SVM算法。我们对这个领域还太陌生,需要您在验证方法和其他指示方面提供指导。
您可以仅使用线性回归模型来实现这一点,因为您正在尝试预测连续结果 (ETA)。
您只需训练一个回归模型,根据您的输入特征(任务类型、天气、季节等)预测预计到达时间。因此,该模型学习的是在给定一组特定输入的情况下完成任务需要多长时间,预测结果就是您随后向客户展示的结果
Logistic regression/SVM 用于对离散结果进行分类(即 categories/groups)。
所以另一种方法可能是将 mysql 数据库中的 ETA 分数分层为 short/medium/long 完成时间,然后使用这 3 个类别作为标签而不是实际数值.然后,您可以使用逻辑回归来训练一个模型,该模型根据您列出的输入特征分类为这 3 个类别。这可行,但由于将 ETA 数据压缩为仅 3 组,您会失去一些分辨率,但这是您必须做出的设计决定。
我可以使用逻辑回归算法根据历史数据预测给定任务的预计到达时间吗?我有一些任务需要花费不同的时间,具体取决于任务类型、天气、季节、请求时间等几个因素。
今天,我们根据 mysql 商店中的任务类型捕获所有任务所花费的时间。现在我们想要添加一个基于因素和任务类型的功能,我们想要预测任务的 ETA 并将其显示给客户。
我们打算用Spark,用Logistic Regression和SVM算法。我们对这个领域还太陌生,需要您在验证方法和其他指示方面提供指导。
您可以仅使用线性回归模型来实现这一点,因为您正在尝试预测连续结果 (ETA)。
您只需训练一个回归模型,根据您的输入特征(任务类型、天气、季节等)预测预计到达时间。因此,该模型学习的是在给定一组特定输入的情况下完成任务需要多长时间,预测结果就是您随后向客户展示的结果
Logistic regression/SVM 用于对离散结果进行分类(即 categories/groups)。
所以另一种方法可能是将 mysql 数据库中的 ETA 分数分层为 short/medium/long 完成时间,然后使用这 3 个类别作为标签而不是实际数值.然后,您可以使用逻辑回归来训练一个模型,该模型根据您列出的输入特征分类为这 3 个类别。这可行,但由于将 ETA 数据压缩为仅 3 组,您会失去一些分辨率,但这是您必须做出的设计决定。