使用 pyramid-arima 预测现有数据以外的数据
Predict beyond existing data using pyramid-arima
我正在为美国各州的房价创建 50 个不同的时间序列模型。我正在使用金字塔 ARIMA 来完成此操作。
数据来自包含日期、州和 Median_Listing_Price 列的 .csv。
我已经创建了模型并希望预测超出我现有数据的值,但我不知道如何执行此操作。
我有一个如下所示的图表:
我想要一个看起来像这样的图表:
我也想将预测值输出到新的 .csv。
当前代码:
# Indexing and creating series
df = pd.read_csv(f'state_csvs/{state}.csv', parse_dates=['Date'], date_parser=dateparse, index_col=0, header=0)
data = df[['Median_Listing_Price']]
# Divide into train and validation set
train = data.loc['2013-11':'2017-01']
valid = data.loc['2017-02':]
# Building the model
model = auto_arima(train, start_p=1, start_q=1, max_p=3, max_q=3, m=12, start_P=0, seasonal=True, d=1, D=1,
trace=True, error_action='ignore', suppress_warnings=True)
model.fit(train)
forecast = model.predict(n_periods=len(valid))
forecast = pd.DataFrame(forecast, index=valid.index, columns=['Prediction'])
# Plot the predictions for validation set
plt.plot(train, label='Train')
plt.plot(valid, label='Valid')
plt.plot(forecast, label='Prediction')
plt.title(f'{state}')
plt.show()
您可以使用以下代码,
import matplotlib as plt
import pandas as pd
#you can continue your code with following code
#But you need to first get final parameters from auto_arima
model.summary() #for getting final parameters
#Look for output like >> Model: ARIMA(x, y, z)
#Now use the following code after yours
model_future = ARIMA(df,order=(x, y, z))
results_future = model_future.fit()
predictions_future = results_future.predict(len(df),len(df)+12,typ = 'levels')
df.plot(legend=True , figsize = (12,8))
predictions_future.plot(legend= True)
#To add future predictions to csv you can use,
predictions_future.to_csv(path_to_folder)
我的输出:
我已经做了 12 个月到未来,你可以有自己的参数设置。
我正在为美国各州的房价创建 50 个不同的时间序列模型。我正在使用金字塔 ARIMA 来完成此操作。
数据来自包含日期、州和 Median_Listing_Price 列的 .csv。
我已经创建了模型并希望预测超出我现有数据的值,但我不知道如何执行此操作。
我有一个如下所示的图表:
我想要一个看起来像这样的图表:
我也想将预测值输出到新的 .csv。
当前代码:
# Indexing and creating series
df = pd.read_csv(f'state_csvs/{state}.csv', parse_dates=['Date'], date_parser=dateparse, index_col=0, header=0)
data = df[['Median_Listing_Price']]
# Divide into train and validation set
train = data.loc['2013-11':'2017-01']
valid = data.loc['2017-02':]
# Building the model
model = auto_arima(train, start_p=1, start_q=1, max_p=3, max_q=3, m=12, start_P=0, seasonal=True, d=1, D=1,
trace=True, error_action='ignore', suppress_warnings=True)
model.fit(train)
forecast = model.predict(n_periods=len(valid))
forecast = pd.DataFrame(forecast, index=valid.index, columns=['Prediction'])
# Plot the predictions for validation set
plt.plot(train, label='Train')
plt.plot(valid, label='Valid')
plt.plot(forecast, label='Prediction')
plt.title(f'{state}')
plt.show()
您可以使用以下代码,
import matplotlib as plt
import pandas as pd
#you can continue your code with following code
#But you need to first get final parameters from auto_arima
model.summary() #for getting final parameters
#Look for output like >> Model: ARIMA(x, y, z)
#Now use the following code after yours
model_future = ARIMA(df,order=(x, y, z))
results_future = model_future.fit()
predictions_future = results_future.predict(len(df),len(df)+12,typ = 'levels')
df.plot(legend=True , figsize = (12,8))
predictions_future.plot(legend= True)
#To add future predictions to csv you can use,
predictions_future.to_csv(path_to_folder)
我的输出:
我已经做了 12 个月到未来,你可以有自己的参数设置。