LSTM 和标签

LSTM and labels

让我们从 "I know ML cannot predict stock markets better than monkeys." 开始 但我只想完成它。

我的问题是理论性的。 假设我有日期、开盘价、最高价、最低价、收盘价作为列。所以我想我有 4 个特征,开盘价、高价、低价、收盘价。

'my_close' 将成为我的标签(答案),我将使用从当前行算起的 'close' 7 天。基本上,我将 'close' 列向上移动了 7 行,并使其成为一个名为 'my_close' 的新列。

LSTM 处理序列。所以说我设定的顺序是20天。 因此我的形状将是(1000 天的数据,20 天的序列,3 个特征)。

困扰我的问题是这20天或一行数据,是否应该有完全相同的标签?或者他们可以有单独的标签吗? 还是我误解了整个理论?

谢谢大家。

在您的例子中,您想使用前 7 天的股票价值预测当天的股票价格。在输入模型之前,构建输入和输出的方式需要进行一些修改。

你在理解时间步长(在你的序列中)时犯了错误。 外行术语中的时间步长(序列)是我们在预测输出时将考虑的输入总数。在您的情况下,它将是 7(不是 20),因为我们将使用前 7 天的数据来预测当天的输出。

您输入的应该是前 7 天的信息

[F11,F12,F13],[F21,F22,F23],.......,[F71,F72,F73]

其中Fij,F代表特征,i代表时间步,j代表特征数。

输出第8天的股价。 在这里,您的模型将分析前 7 天的输入并预测输出。 因此,为了回答您的问题,您将有一个用于前 7 天输入的通用标签。

我强烈建议你多学习一下 LSTM。