我的数据中用于训练股票价格预测器的目标是什么?

What's the target in my data for training a stock price predictor?

我想为委内瑞拉的经济指标构建一个股票价格预测器,我已经清理并构建了我想使用的历史数据(从过去 10 年开始),但我有疑问,因为这是我的第一次机器学习项目,我的 CSV 数据包含 3000 多个条目,如下所示:

2553
11-28-2017;0.8823561
2554
11-29-2017;0.9679446
2555
11-30-2017;0.9719271
2556
12-1-2017;1.0302427

如您所见,第 0 列有日期,第 1 列有那个特定日期的价格,在这种情况下,训练数据 (X) 应该是价格,但是我想使用的方法期望 X和 Y(监督学习),因为这是我第一次获得自己的数据,我觉得有点迷茫,到目前为止你有我的代码:https://github.com/marcelodiaz558/Venezuela-dollar-price-predictor/blob/development/model.ipynb 我想在未来用 LSTM 或者也许我先从一个简单的人工神经网络开始做测试,当我解开对数据的疑惑时,我不知道Y应该是谁。

Y / 你的目标就是你想要预测的。 X / 你的训练数据是你先验知识的某种向量表示,可用于更好地预测未知量。在使用简单回归量的简单时间序列预测中,您的训练数据可能是过去 N 天的价格。

因此,使用您的示例数据,您希望能够根据过去两天 (N=2) 的价格预测未来某一天的价格,您的 XY 将是

X = [[0.8823561, 0.9679446], [0.9679446, 0.9719271]]
Y = [0.9719271, 1.0302427]

因此,要对您的数据进行机器学习,您需要根据您的需要对数据进行预处理。一些算法是专门为此任务设计的,因此不需要预处理或在实现中自动完成。

很遗憾,您选择了一个难题来开始学习 ML:Time Series

这里的问题是您必须尊重值的顺序。

所以一个时间序列有:

Timestamp t-3: 0.8823561
Timestamp t-2: 0.9679446
Timestamp t-1: 0.9719271
Timestamp t(prediction/ y): 1.0302427 

R 附带了一个非常好的包,叫做:ARIMA。 一个问题是你必须检查你是否有季节性数据(一些模式经常出现在你的数据中),固定数据(如果数据趋势是固定的)。

我的建议是,如果您只想开始机器学习,请使用鸢尾花数据集解决分类问题。