auto_arima 即使时间序列是固定的并且在 Python 中没有季节性成分,也会将最佳模型返回为 SARIMAX
auto_arima returning the best model as SARIMAX even when time series is stationary and has no seasonal component in Python
我有一个频率为每天的时间序列数据集。我已经使用增强的 dickey-fuller 测试检查了我的数据集是否静止。
之后,当我尝试使用以下方法确定 p、d、q 的值时:
from pmdarima import auto_arima
stepwise_fit = auto_arima(df2['Births'],start_p=0,max_p=6, start_q=0, max_q=3, seasonal=False,trace=True)
此外,我在 auto_arima 参数中提到了 seasonal=False,但是当我这样做时:
stepwise_fit.summary()
返回:
SARIMAX Results
Dep. Variable: y No. Observations: 365
Model: SARIMAX(1, 1, 1) Log Likelihood -1226.077
Date: Mon, 17 Feb 2020 AIC 2460.154
Time: 20:02:17 BIC 2475.743
Sample: 0 HQIC 2466.350
- 365
Covariance Type: opg
coef std err z P>|z| [0.025 0.975]
intercept 0.0132 0.014 0.975 0.330 -0.013 0.040
ar.L1 0.1299 0.059 2.217 0.027 0.015 0.245
ma.L1 -0.9694 0.016 -62.235 0.000 -1.000 -0.939
sigma2 48.9989 3.432 14.279 0.000 42.273 55.725
Ljung-Box (Q): 36.69 Jarque-Bera (JB): 26.17
Prob(Q): 0.62 Prob(JB): 0.00
Heteroskedasticity (H): 0.97 Skew: 0.58
Prob(H) (two-sided): 0.85 Kurtosis: 3.62
我们可以看到,它返回的模型是:SARIMAX(1, 1, 1)。我们可以从中推断出什么?任何建议都有帮助,或者如果我遗漏了什么。
我找到了显示 SARIMAX(1, 1, 1) 的原因。它仅仅意味着 ARIMA 只是因为 SARIMAX 的格式基本上是 SARIMAX(p,d,q)(P,D,Q) 其中 P,D,Q 是季节性参数,所以,在我们的例子中 SARIMAX(1 ,1,1)(0,0,0) 个季节性分量仅为零。
我有一个频率为每天的时间序列数据集。我已经使用增强的 dickey-fuller 测试检查了我的数据集是否静止。
之后,当我尝试使用以下方法确定 p、d、q 的值时:
from pmdarima import auto_arima
stepwise_fit = auto_arima(df2['Births'],start_p=0,max_p=6, start_q=0, max_q=3, seasonal=False,trace=True)
此外,我在 auto_arima 参数中提到了 seasonal=False,但是当我这样做时:
stepwise_fit.summary()
返回:
SARIMAX Results
Dep. Variable: y No. Observations: 365
Model: SARIMAX(1, 1, 1) Log Likelihood -1226.077
Date: Mon, 17 Feb 2020 AIC 2460.154
Time: 20:02:17 BIC 2475.743
Sample: 0 HQIC 2466.350
- 365
Covariance Type: opg
coef std err z P>|z| [0.025 0.975]
intercept 0.0132 0.014 0.975 0.330 -0.013 0.040
ar.L1 0.1299 0.059 2.217 0.027 0.015 0.245
ma.L1 -0.9694 0.016 -62.235 0.000 -1.000 -0.939
sigma2 48.9989 3.432 14.279 0.000 42.273 55.725
Ljung-Box (Q): 36.69 Jarque-Bera (JB): 26.17
Prob(Q): 0.62 Prob(JB): 0.00
Heteroskedasticity (H): 0.97 Skew: 0.58
Prob(H) (two-sided): 0.85 Kurtosis: 3.62
我们可以看到,它返回的模型是:SARIMAX(1, 1, 1)。我们可以从中推断出什么?任何建议都有帮助,或者如果我遗漏了什么。
我找到了显示 SARIMAX(1, 1, 1) 的原因。它仅仅意味着 ARIMA 只是因为 SARIMAX 的格式基本上是 SARIMAX(p,d,q)(P,D,Q) 其中 P,D,Q 是季节性参数,所以,在我们的例子中 SARIMAX(1 ,1,1)(0,0,0) 个季节性分量仅为零。