时间序列中的相关残差
Correlated residuals in time series
我使用 "vars" R 包进行多变量时间序列分析。问题是当我进行双变量 VAR 时,serial.test() 的结果总是给出非常低的 p 值,因此我们拒绝 H0 并且残差是相关的。正确的做法是增加 VAR 的阶数,但即使阶数非常高(p=20 或更高),我的残差仍然相关。
怎么可能?
我真的不能给你一个可重现的代码,因为我不知道如何重现残差总是相关的 VAR。对我来说,这是一个非常不寻常的情况,但如果有人知道这是怎么可能的,那就太好了。
这可能是 Cross Validated 更好的问题,因为它不包含任何 R 代码或可重现的示例,但您可能需要比 "I have a low p-value" 做更多的挖掘工作。您是否测试过数据的正态性?另外,要说
The right thing to do is to increase the order of the VAR
非常不准确。您正在处理哪种类型的数据,您会将滞后阶数设置为高达 20?年度数据的典型值为 1,季度数据为 4,月度数据为 12。您不能对问题提出越来越高的要求,并期望它能解决基础数据中的问题。
假设您有一个最佳滞后值并且您的数据呈正态分布并且您的 p 值仍然很低,那么有几种方法可以实现。
少量正序列相关(例如,lag-1 残差自相关在 0.2 到 0.4 范围内,或 Durbin-Watson 统计量在 1.2 到 1.6 之间)表明模型中有一些微调空间.考虑添加因变量的滞后 and/or 某些自变量的滞后。或者,如果您的统计软件中有可用的 ARIMA+回归程序,请尝试向回归模型添加 AR(1) 或 MA(1) 项。 AR(1) 项向预测方程添加因变量的滞后,而 MA(1) 项添加预测误差的滞后。如果在滞后 2 处存在显着相关性,则二阶滞后可能是合适的。
如果残差中存在显着的负相关(lag-1 自相关比 -0.3 更负或 DW stat 大于 2.6),请注意您可能对某些变量进行了过度差分的可能性。差分倾向于在负方向上驱动自相关,太多的差分可能导致人为的负相关模式,滞后变量无法纠正。
如果在季节性期间存在显着相关性(例如,季度数据滞后 4 或月度数据滞后 12),这表明模型中未正确考虑季节性因素。可以通过以下方式之一在回归模型中处理季节性:(i)季节性调整变量(如果它们尚未进行季节性调整),或(ii)使用季节性滞后 and/or 季节性差异变量(注意:注意不要过度差异!),或(iii)向模型添加季节性虚拟变量(即,一年中不同季节的指标变量,例如 MONTH=1 或 QUARTER=2 等)虚拟变量方法使作为回归模型的一部分执行的加性季节性调整:可以为一年中的每个季节估计不同的加性常数。如果已记录因变量,则季节性调整是乘法的。 (还有一点需要注意:虽然您的因变量已经进行了季节性调整,但您的一些自变量可能没有,这可能会导致它们的季节性模式泄漏到预测中。)
序列相关的主要情况(Durbin-Watson 统计量远低于 1.0,自相关远高于 0.5)通常表明模型中存在基本结构问题。您可能希望重新考虑已应用于因变量和自变量的转换(如果有)。它可能有助于通过差分、日志记录、and/or 收缩的适当组合来稳定所有变量。
我使用 "vars" R 包进行多变量时间序列分析。问题是当我进行双变量 VAR 时,serial.test() 的结果总是给出非常低的 p 值,因此我们拒绝 H0 并且残差是相关的。正确的做法是增加 VAR 的阶数,但即使阶数非常高(p=20 或更高),我的残差仍然相关。 怎么可能?
我真的不能给你一个可重现的代码,因为我不知道如何重现残差总是相关的 VAR。对我来说,这是一个非常不寻常的情况,但如果有人知道这是怎么可能的,那就太好了。
这可能是 Cross Validated 更好的问题,因为它不包含任何 R 代码或可重现的示例,但您可能需要比 "I have a low p-value" 做更多的挖掘工作。您是否测试过数据的正态性?另外,要说
The right thing to do is to increase the order of the VAR
非常不准确。您正在处理哪种类型的数据,您会将滞后阶数设置为高达 20?年度数据的典型值为 1,季度数据为 4,月度数据为 12。您不能对问题提出越来越高的要求,并期望它能解决基础数据中的问题。
假设您有一个最佳滞后值并且您的数据呈正态分布并且您的 p 值仍然很低,那么有几种方法可以实现。
少量正序列相关(例如,lag-1 残差自相关在 0.2 到 0.4 范围内,或 Durbin-Watson 统计量在 1.2 到 1.6 之间)表明模型中有一些微调空间.考虑添加因变量的滞后 and/or 某些自变量的滞后。或者,如果您的统计软件中有可用的 ARIMA+回归程序,请尝试向回归模型添加 AR(1) 或 MA(1) 项。 AR(1) 项向预测方程添加因变量的滞后,而 MA(1) 项添加预测误差的滞后。如果在滞后 2 处存在显着相关性,则二阶滞后可能是合适的。
如果残差中存在显着的负相关(lag-1 自相关比 -0.3 更负或 DW stat 大于 2.6),请注意您可能对某些变量进行了过度差分的可能性。差分倾向于在负方向上驱动自相关,太多的差分可能导致人为的负相关模式,滞后变量无法纠正。
如果在季节性期间存在显着相关性(例如,季度数据滞后 4 或月度数据滞后 12),这表明模型中未正确考虑季节性因素。可以通过以下方式之一在回归模型中处理季节性:(i)季节性调整变量(如果它们尚未进行季节性调整),或(ii)使用季节性滞后 and/or 季节性差异变量(注意:注意不要过度差异!),或(iii)向模型添加季节性虚拟变量(即,一年中不同季节的指标变量,例如 MONTH=1 或 QUARTER=2 等)虚拟变量方法使作为回归模型的一部分执行的加性季节性调整:可以为一年中的每个季节估计不同的加性常数。如果已记录因变量,则季节性调整是乘法的。 (还有一点需要注意:虽然您的因变量已经进行了季节性调整,但您的一些自变量可能没有,这可能会导致它们的季节性模式泄漏到预测中。)
序列相关的主要情况(Durbin-Watson 统计量远低于 1.0,自相关远高于 0.5)通常表明模型中存在基本结构问题。您可能希望重新考虑已应用于因变量和自变量的转换(如果有)。它可能有助于通过差分、日志记录、and/or 收缩的适当组合来稳定所有变量。