TimeSeriesDataSet class 的 group_ids 参数在 PyTorch 预测中具体做什么?
What does the group_ids parameter of the TimeSeriesDataSet class specifically do in PyTorch Forecasting?
我目前正在使用 PyTorch 预测,我想使用 TimeSeriesDataSet 创建数据集。我的原始数据位于 pandas Dataframe 中,如下所示:
date amount location
2014-01-01 5 A
2014-01-01 7 B
... ... ...
2017-12-30 4 H
2017-12-31 8 I
因此,我总共在“位置”中获得了九个不同的唯一值以及每个日期每个位置的金额。现在我想知道 TimeSeriesDataSet class 的 group_ids 参数是做什么的,它的确切行为是什么?我并没有真正理解基于 documentation.
的想法
提前致谢!
一个时间序列数据集通常包含多个时间序列用于不同的entities/individuals。
group_ids
是一个列列表,它唯一确定具有关联时间序列的实体。在您的示例中,它将是 location
:
group_ids (List[str]) – list of column names identifying a time series. This means that the group_ids identify a sample together with the time_idx
. If you have only one timeseries, set this to the name of column that is constant.
我目前正在使用 PyTorch 预测,我想使用 TimeSeriesDataSet 创建数据集。我的原始数据位于 pandas Dataframe 中,如下所示:
date amount location
2014-01-01 5 A
2014-01-01 7 B
... ... ...
2017-12-30 4 H
2017-12-31 8 I
因此,我总共在“位置”中获得了九个不同的唯一值以及每个日期每个位置的金额。现在我想知道 TimeSeriesDataSet class 的 group_ids 参数是做什么的,它的确切行为是什么?我并没有真正理解基于 documentation.
的想法提前致谢!
一个时间序列数据集通常包含多个时间序列用于不同的entities/individuals。
group_ids
是一个列列表,它唯一确定具有关联时间序列的实体。在您的示例中,它将是 location
:
group_ids (List[str]) – list of column names identifying a time series. This means that the group_ids identify a sample together with the
time_idx
. If you have only one timeseries, set this to the name of column that is constant.