使用 LSTM 神经网络时如何考虑不同时间间隔的罕见事件?

How to account for rare events at different time intervals while using LSTM neural networks?

我正在研究一个有趣的序列到序列(回归)时间序列问题,其中一些静态 features/rare 事件可以改变未来时间序列的行为。这个问题是一个预测问题,我使用以前的时间步长值来预测下一个时间步长的值,我尝试将静态特征+罕见事件集成到时间步长 t=0.

在我的问题中,除了一些应该影响时间序列未来行为的静态特征之外,在 t=0 总是有一个罕见的事件。

为清楚起见,我对“罕见事件”的定义是:在特定时间步长发生的事件(例如:t=0)和另一个单独的事件也可能在未来的任何时间发生(例如: t=n) 除了在 t=0 发生的事件之外,它在那个时间只发生一次,并且这两个事件都会影响从它们发生的时间开始的未来时间序列行为。

尽管大多数静态特征不会随时间变化,但罕见事件可能彼此不同(具有不同 characteristics/features)。每个事件的时间通常是已知的,因为它会由于外部人为干预而被应用以优化未来行为(增加利润)但是,它们不一定在每个 sample/example.[=11 的同一时间步发生。 =]

这些事件非常罕见,以至于我将它们视为 time=0 时的静态特征是有意义的,但是,我想不出一种方法来包含在未来,与 t=0 时的事件具有不同的特征。

下面是问题的示例示意图。这些独特的罕见事件可能会影响多个具有不同时间步长的样本,但如果我不考虑这些事件,我相信我的预测可能会受到影响。

任何人都可以建议任何资源来查看这些类型的问题吗?我也可能遗漏了通常用于此类问题的关键词,这可能是我仍然难以找到好的资源的原因之一。我称它为“罕见事件”,但是,在文献中它可能被称为其他东西......在这一点上,我很欣赏解决这个问题的任何类型的来源,例如科学 papers/articles、github 代码或您提供的代码示例,更正要搜索的关键字等

谢谢。

Example image to describe the problem

我在你提到的图片中看到了你的稀有事件,从图片中存在的少量信息可以看出,稀有事件中存在一些季节性。因此,如果您使用 rare 来指出随机事件,我认为这是不正确的,因为它具有季节性(周期性)。 简而言之,您担心用于训练模型的功能。

  1. 正常事件
  2. 罕见事件

There may be multiple samples with varying time steps affected by these unique rare events but, if I don't account for these events, I believe my predictions may suffer.

如果您不确定您提到的稀有功能是否有贡献等

您必须切换到基于注意力的机制,因为:

“你只需要注意”

Bert 等这些模型比 LSTM 好得多,因为它们增加了注意力 (重要性)特征到每个特征,因此模型将自动学习应该为稀有特征和普通特征添加多少权重。 我用非常笼统的术语进行解释,因为您的问题并不太具体。 祝你今天过得愉快 保持幸福!