创建对称自相关矩阵
Creating symmetric autocorrelation matrix
我正在对时间序列数据向量执行自相关过程。我希望创建一个由给定时间序列的自相关组成的对称矩阵。
我正在使用 acf()
函数来检查我的值,它 returns:
“acfData”系列的自相关,滞后
0 1 2 3 4 5 6 7 8 9 10 11 12 13
1.000 -0.038 0.253 0.266 0.250 0.267 -0.182 0.281 -0.013 -0.067 -0.122 -0.115 -0.023 -0.337
为了获得矩阵,我然后对数据执行 data.frame 更改,以允许我按指定的延迟滑动值:
dataF <- data.frame("data" = acfData)
names(dataF)[1] <- "acfData"
dataLag <- slide(dataF, "acfData", slideBy = -1)
给予:
> head(dataLag)
acfData acfData-1
1 -7 NA
2 5 -7
3 4 5
4 -17 4
5 6 -17
6 -10 6
当我执行 cor()
函数时,这给出了正确的 2x2 矩阵:
> cor(na.omit(dataLag))
acfData acfData-1
acfData 1.00000000 -0.03842146
acfData-1 -0.03842146 1.00000000
然而,将其扩展到第二个时间滞后矩阵会导致先前的值发生变化。
dataLag <- cbind(dataLag, slide(dataF, "acfData", slideBy = -2)[2])
> head(dataLag)
acfData acfData-1 acfData-2
1 -7 NA NA
2 5 -7 NA
3 4 5 -7
4 -17 4 5
5 6 -17 4
6 -10 6 -17
再次执行 cor()
函数会导致:
> cor(na.omit(dataLag))
acfData acfData-1 acfData-2
acfData 1.00000000 -0.03156163 0.27502462
acfData-1 -0.03156163 1.00000000 -0.07361449
acfData-2 0.27502462 -0.07361449 1.00000000
如您所见,滞后 1 步的数据相关性已发生变化。我认为这是由于 na.omit()
可能由于第二个滞后的介绍而删除了整个前两行,给出了两个 NA
s,但我不确定如何在第一个滞后中正确地省略它们计算。
正如 Ben Bolker 在评论中提到的,只需添加 "pairwise.complete.obs" 的 'use' 参数即可正确省略 NA。
函数的新 return 是:
> cor(dataLag, use="pairwise.complete.obs")
acfData acfData-1 acfData-2
acfData 1.00000000 -0.03842146 0.27502462
acfData-1 -0.03842146 1.00000000 -0.07361449
acfData-2 0.27502462 -0.07361449 1.00000000
我正在对时间序列数据向量执行自相关过程。我希望创建一个由给定时间序列的自相关组成的对称矩阵。
我正在使用 acf()
函数来检查我的值,它 returns:
“acfData”系列的自相关,滞后
0 1 2 3 4 5 6 7 8 9 10 11 12 13
1.000 -0.038 0.253 0.266 0.250 0.267 -0.182 0.281 -0.013 -0.067 -0.122 -0.115 -0.023 -0.337
为了获得矩阵,我然后对数据执行 data.frame 更改,以允许我按指定的延迟滑动值:
dataF <- data.frame("data" = acfData)
names(dataF)[1] <- "acfData"
dataLag <- slide(dataF, "acfData", slideBy = -1)
给予:
> head(dataLag)
acfData acfData-1
1 -7 NA
2 5 -7
3 4 5
4 -17 4
5 6 -17
6 -10 6
当我执行 cor()
函数时,这给出了正确的 2x2 矩阵:
> cor(na.omit(dataLag))
acfData acfData-1
acfData 1.00000000 -0.03842146
acfData-1 -0.03842146 1.00000000
然而,将其扩展到第二个时间滞后矩阵会导致先前的值发生变化。
dataLag <- cbind(dataLag, slide(dataF, "acfData", slideBy = -2)[2])
> head(dataLag)
acfData acfData-1 acfData-2
1 -7 NA NA
2 5 -7 NA
3 4 5 -7
4 -17 4 5
5 6 -17 4
6 -10 6 -17
再次执行 cor()
函数会导致:
> cor(na.omit(dataLag))
acfData acfData-1 acfData-2
acfData 1.00000000 -0.03156163 0.27502462
acfData-1 -0.03156163 1.00000000 -0.07361449
acfData-2 0.27502462 -0.07361449 1.00000000
如您所见,滞后 1 步的数据相关性已发生变化。我认为这是由于 na.omit()
可能由于第二个滞后的介绍而删除了整个前两行,给出了两个 NA
s,但我不确定如何在第一个滞后中正确地省略它们计算。
正如 Ben Bolker 在评论中提到的,只需添加 "pairwise.complete.obs" 的 'use' 参数即可正确省略 NA。
函数的新 return 是:
> cor(dataLag, use="pairwise.complete.obs")
acfData acfData-1 acfData-2
acfData 1.00000000 -0.03842146 0.27502462
acfData-1 -0.03842146 1.00000000 -0.07361449
acfData-2 0.27502462 -0.07361449 1.00000000