误差校正方法 时间序列预测
Error Correction methodologies Time Series Forecast
你有什么关于纠正预测偏差的阅读建议吗?例如,我使用 ARIMA 模型来预测时间序列。有没有办法根据回测结果来修正预测的偏差?
如何处理所有在场的 Bias
/ Overfit
斗争?
使用战术方法:
一个主要的方法是通过两步法。
您必须将可用的数据集分成两部分,以便模拟接近 "Future" 和 "hide" -- 比如说大约 20-30% 的观察值 -- 第二部分来自 [1] Training 过程的数据集,发现它在称为 CrossValidation 的步骤 [2] 中使用预测。
这种方法允许搜索 Predictor 引擎配置的 StateSPACE 和与数据相关的 bias/overfit。有些只使用最小化搜索的前一部分(最低误差/最高效用函数),有些只使用后者(类似于 Leo Breiman 对基于集成的方法的 RandomForest
修改),有些两者都使用。
- 在
aTrainingSubPartOfAvailableDataSET
上训练预配置的预测器
- 一旦 Predictor 的这种配置得到训练,交叉验证 该配置的预测能力不会
aCrossValidationSubPartOfAvailableDataSET
在训练过程中看到(步骤 1.)观察 Bias
/ Overfit
人工制品和 继续朝着合理配置设置的最低交叉验证错误/最佳泛化区域前进。
你有什么关于纠正预测偏差的阅读建议吗?例如,我使用 ARIMA 模型来预测时间序列。有没有办法根据回测结果来修正预测的偏差?
如何处理所有在场的 Bias
/ Overfit
斗争?
使用战术方法:
一个主要的方法是通过两步法。
您必须将可用的数据集分成两部分,以便模拟接近 "Future" 和 "hide" -- 比如说大约 20-30% 的观察值 -- 第二部分来自 [1] Training 过程的数据集,发现它在称为 CrossValidation 的步骤 [2] 中使用预测。
这种方法允许搜索 Predictor 引擎配置的 StateSPACE 和与数据相关的 bias/overfit。有些只使用最小化搜索的前一部分(最低误差/最高效用函数),有些只使用后者(类似于 Leo Breiman 对基于集成的方法的 RandomForest
修改),有些两者都使用。
- 在
aTrainingSubPartOfAvailableDataSET
上训练预配置的预测器
- 一旦 Predictor 的这种配置得到训练,交叉验证 该配置的预测能力不会
aCrossValidationSubPartOfAvailableDataSET
在训练过程中看到(步骤 1.)观察Bias
/Overfit
人工制品和 继续朝着合理配置设置的最低交叉验证错误/最佳泛化区域前进。