如何在 R 或 Matlab 中将这个不规则间隔的时间序列转换(插值)为规则间隔的时间序列?

How to turn (interpolate) this irregularly spaced time series into a regularly spaced one in R or Matlab?

我有以下数据:

Lines = "20/03/2014,9996792524
21/04/2014,8479115468
21/09/2014,11394750532
16/10/2014,9594869828
18/11/2014,10850291677
08/12/2014,10475635302
22/01/2015,10116010939
26/02/2015,11206949341
20/03/2015,11975140317
09/04/2015,11526960332
29/04/2015,9986194500
16/09/2015,11501088256
13/10/2015,11833183163
10/11/2015,13246940910
16/12/2015,13255698568
27/01/2016,13775653990
23/02/2016,13567323648
22/03/2016,14607415705
11/04/2016,13835444224
04/04/2016,14118970743"

我读入 R:

z <- read.zoo(text = Lines, sep = ",", header = TRUE, index = 1:1, tz = "", format = "%d/%m/%Y")

我希望对数据进行插值,以便将这个间隔不规则的时间序列转换为常规时间序列。时间间隔无所谓,只要有规律即可,但每月、每周或每两周一次都可以。

如何在 RMatlab 中执行此操作?

注意:我意识到内插值可能不是很准确并且可能会歪曲信息,但是我需要学习如何做到这一点并且我可以接受失去一些准确性。

好的,首先,警告:如果你要插值然后执行测试或一般统计估计,你的结果将(严重)有偏见,除非你有一些充分的理由(领域知识? ) 假设您的插值方法将生成来自原始点的相同分布的点。不,"the plot looks good" 不是评估这个的好标准 :) 话虽如此,让我们来看看数据:

# Lines contains your data
library(zoo)
fmt <- "%d/%m/%Y" 
z <- read.zoo(text = Lines, sep = ",", header = TRUE, index = 1:1, tz = "", format = fmt)
t <- time(z)
plot(z,type="p",xaxt="n",pch=19,col="cyan",cex=1.5)
labs <- format(t,fmt)
axis(side = 1, at = t, labels = labs,cex.axis = 0.7)    

您丢失的大部分数据似乎都与 2014 年夏季和 2015 年夏季有关。我很想知道这些数据是什么...无论如何,看起来您的大部分数据间隔至少 2 周:

diff(t)
# Time differences in days
# [1] 153  25  33  20  45  35  22  20  20 140  27  28  36  42  27  28  13   7

因此,让我们通过首先创建一个虚拟 zoo 对象来插入双周系列:

t.biweekly <- seq(from = min(t), to=max(t),by="2 weeks")
dummy <- zoo(,t.biweekly)

将虚拟系列与您的系列合并:

z.interpolated <- merge(z,dummy,all=TRUE)

如果您查看新系列,您会发现在 dummy 的所有时间都有 NA 值,而在 z 中没有相应的时间。让我们用线性插值填充这些点并查看结果:

z.interpolated <- na.approx(z.interpolated)
plot(z.interpolated, type = "b")
points(z,pch=19,col="cyan",cex=1.5)

瞧!请记住,从这个东西中建立推理模型是一个坏主意...