使用天气数据进行需求预测

Demand forecast using weather data

我正在尝试编写一份需求预测,逐一(或全部)考虑天气数据(温度、压力、湿度)。我想使用机器学习算法来做到这一点。我以前使用线性回归来做需求预测,之前没有考虑天气数据,现在我有了天气数据,我不确定我应该使用哪种机器学习算法来完成任务?我是机器学习的新手,如果你能帮我解决这个问题,我将不胜感激。

我正在使用 Python 作为我的代码,所以如果你能指导我使用任何特定的模块,那就太好了。

好的,如果您是机器学习的新手,我建议您按照以下方法创建预测模型。

  1. 了解您的数据:手动检查您拥有的输入变量如何与目标(输出)相关。如果它们表现出某种线性依赖关系,那么你很幸运,但最具挑战性的是,如果你发现这种关系具有非线性关系。
  2. 变量选择:您永远无法确定您的所有输入是否都是预测输出所必需的。示例:如果压力和温度以某种方式相关,也许您的 ML 算法可以仅使用这 2 个输入之一来预测您的输出。相反,可能有一些变量实际上会干扰您对 ML 算法的预测。因此,您需要一些相关性度量来表明哪些输入与您的输出高度相关(历史数据,例如:来自 UCI 存储库)。如果您发现数据之间存在线性相关性,我建议使用 Pearsons Correlation、Spearmanns Rho。如果不是,您可以使用 MIC、Relieff weights 等作为非线性数据的相关度量。
  3. 使用哪种 ML 算法:这完全取决于数据,也许只需多项式或最小二乘法就足够了(对于线性相关性),或者最坏的情况是您有一些多层神经网络或高斯过程(对于非线性相关性)。 推荐:正如你所说的你想要线性回归,从最小二乘拟合开始。 如果您在理解任何概念时仍然有问题,您可以通过一些关于您的输入与输出的关系图与我联系,我可以为您提供更好的建议。 祝你好运

我也在做同样的事情。只需要带有深度神经网络的 Tensorflow。我相信卷积 LSTM 神经网络可以将天气数据作为输入并给出预测作为输出。你只需要历史数据来训练它。也许是历书结合预报和预报时的测量数据。

研究表明,卷积长短期记忆 (ConvLSTM) 算法在预测降水方面比 FC_LSTM 和当前最先进的 ROVER 算法更准确。这是论文:https://arxiv.org/abs/1506.04214

研究还表明,可以使用 NOAA 的数据预测风,并且机器学习算法的预测效果优于 NOAA。论文在这里:http://aditya-grover.github.io/files/publications/kdd15.pdf

最后,研究表明,使用每小时测量的 15 年数据周期,可以准确预测 72 小时内的温度、湿度和风力。训练算法所需的一切都在本文中详细说明:Sequence to Sequence Weather Forecasting with Long 短期记忆递归神经网络,国际计算机应用杂志 (0975 - 8887) 2016年6月第143期第11期