用于时间序列分析的 ts 文件的最佳格式是什么?
What is the best format for a ts file for time series analysis?
我刚开始在 R
中进行 time series
分析,我很难找出 ts
文件的最佳格式。
我将从 csv
文件中将数据导入 R,数据框将如下所示:
date sales
2015/01/01 150
2015/02/01 200
2015/03/01 175
...
我的目标是将此数据分解成 time series
个组成部分:季节性、趋势和不规则
我可以保留数据原样,然后将其转换为 ts
格式并继续我的分析吗?
我也看到过以下格式的时间序列数据:
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2015 150 200 175 ...
2016 250 420 350 ...
...
这两种格式中的哪一种最适合 R
中的 time series
分析?有区别吗?
对于每月数据,最简单的方法是使用 ts()
,例如
ts(data, start=c(2015,1), freq=12)
这将生成您在上次 table 中引用的时间序列对象。 R 中的某些函数要求您的时间序列是一个 ts()
对象,以便它可以经常通过 tsp()
记录频率,例如stats::stl
。 tsp()
returns 时间序列的属性,即开始日期、结束日期、频率。有些还需要来自 library(xts)
的 xts()
-objects,通常用于每小时或更高频率的数据。对于多季节数据,您可以使用 library(forecast)
中的 msts()
,例如forecast::tbats
.
我刚开始在 R
中进行 time series
分析,我很难找出 ts
文件的最佳格式。
我将从 csv
文件中将数据导入 R,数据框将如下所示:
date sales
2015/01/01 150
2015/02/01 200
2015/03/01 175
...
我的目标是将此数据分解成 time series
个组成部分:季节性、趋势和不规则
我可以保留数据原样,然后将其转换为 ts
格式并继续我的分析吗?
我也看到过以下格式的时间序列数据:
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2015 150 200 175 ...
2016 250 420 350 ...
...
这两种格式中的哪一种最适合 R
中的 time series
分析?有区别吗?
对于每月数据,最简单的方法是使用 ts()
,例如
ts(data, start=c(2015,1), freq=12)
这将生成您在上次 table 中引用的时间序列对象。 R 中的某些函数要求您的时间序列是一个 ts()
对象,以便它可以经常通过 tsp()
记录频率,例如stats::stl
。 tsp()
returns 时间序列的属性,即开始日期、结束日期、频率。有些还需要来自 library(xts)
的 xts()
-objects,通常用于每小时或更高频率的数据。对于多季节数据,您可以使用 library(forecast)
中的 msts()
,例如forecast::tbats
.