Pandas: 我可以根据员工今年的工作天数和小时数来预测他们明年的工作时间吗?

Pandas: Can i predict how many hours my employees are going to work next year based on how many days and hours they worked this year?

我打算预测 2023 我的员工的工作时间和天数,每个员工都有 DaysCount=他工作的天数,还有 HoursWorked=他在工作中花费的时间。问题是,这可能吗?我可以根据这两个值预测明年的统计数据吗? 有什么想法吗?

是的,你可以,但也许,这将是一个不精确的解决方案。但是,我会尽力帮助您找到解决方案。

  • 属性数量:首先,机器学习模型需要关于人物历史的良好特征来预测他们的未来,只使用两个属性可能不足以进行准确的预测。

  • 培训规模:另一个重要的方面是培训规模,比如你对所有员工都有长期历史吗?例如,您是否有每位员工过去十年的个人历史记录?

  • 建模: 您应该考虑的一个重要方面是建模。你想如何训练模型?例如,您是否会使用 1 月的员工历史来预测 2 月?或者,您是否将使用 2021 年员工的历史数据来预测 2022 年,并使用此模型来预测 2023 年?你有任何其他功能来喂养模型吗?如何解释工作天数和小时数?例如,工作时间可以用星期来解释,这意味着,如果你在一家餐馆工作(例如),你可以在周末工作更多。因此,建模知道星期几很重要。天数可能会受到 vacations/hollydays 的影响,因此,在数据中包含这些信息应该非常重要。之后,您必须考虑如何将数据拆分为训练和测试。您是否会使用最后 seven-days 的历史数据来预测下一天?或者,您将使用上个月的历史数据来预测下个月?