给定一个大小适中的数据集,开始对其进行预测的第一步是什么?

Given a decently-sized dataset, what's the first step to start making predictions on it?

所以我得到了一个包含 550k 历史事件的数据库。 对于每个事件,我都有一个可能的结果列表,以及实际结果。

我想用它来预测未来的事件。

我对培训的工作原理有一个大概的了解(理论上),但我是这个领域的新手。

我从哪里开始?

您选择了难题作为开始。 我将从 NLP 或表格模型开始并深入研究。