TimeSeriesDataSet class 的 group_ids 参数在 PyTorch 预测中具体做什么?

What does the group_ids parameter of the TimeSeriesDataSet class specifically do in PyTorch Forecasting?

我目前正在使用 PyTorch 预测,我想使用 TimeSeriesDataSet 创建数据集。我的原始数据位于 pandas Dataframe 中,如下所示:

date         amount        location 
2014-01-01     5               A
2014-01-01     7               B
    ...       ...             ...
2017-12-30     4               H
2017-12-31     8               I

因此,我总共在“位置”中获得了九个不同的唯一值以及每个日期每个位置的金额。现在我想知道 TimeSeriesDataSet class 的 group_ids 参数是做什么的,它的确切行为是什么?我并没有真正理解基于 documentation.

的想法

提前致谢!

一个时间序列数据集通常包含多个时间序列用于不同的entities/individuals。

group_ids 是一个列列表,它唯一确定具有关联时间序列的实体。在您的示例中,它将是 location:

group_ids (List[str]) – list of column names identifying a time series. This means that the group_ids identify a sample together with the time_idx. If you have only one timeseries, set this to the name of column that is constant.