模型是否完全看不到 Pycaret 时间序列(测试版)中使用的测试数据?

is test data used in Pycaret time series(beta) completely unseen by the model(s)?

Post 检查官方 documentation and example,我仍然感到困惑,如果测试数据传递给 setup 函数完全没有被模型看到???

from pycaret.datasets import get_data
from pycaret.internal.pycaret_experiment import TimeSeriesExperiment

# get data
y = get_data('airline', verbose=False)

# no of future steps to forecast
fh = 12 # or alternately fh = np.arange(1,13)
fold = 3

# setup
exp = TimeSeriesExperiment()
exp.setup(data=y, fh=fh, fold = fold)
exp.models()

描述如下:

此外,在 cv-graph 上查看,我们可以得出结论,测试数据集未被使用,而 cv。但是,仍然没有任何地方提到它,需要一个具体的证据。

训练-测试拆分

训练 c-v 拆分

如果您注意到 cv 拆分,它们根本不使用测试数据。因此任何使用 Cross-Validation 的步骤,例如 create_modeltune_modelblend_modelcompare_models,根本不会使用测试数据进行训练。

一旦您对这些步骤中的模型感到满意,就可以使用 finalize_model 完成模型。在这种情况下,您传递给 finalize_model 的任何模型都会在完整的数据集(训练 + 测试)上进行训练,以便您可以做出真实的未来预测。