R 时间序列 - 识别缺失的观察值(时间戳)并插入 NA 以创建给定长度的时间序列
R timeseries - identify missing observations (timestamps) and insert NAs to create time series of given length
我有一组 24 个分组(分层)时间序列,据说 运行 超过 3 年,我想查看每月销售额,但事实证明其中一些缺少观察值,例如
getCounts(Shop1, ...)
2011-01 2011-02 2011-03 2011-04 2011-05 2011-06 2011-07 2011-08 2011-09 2011-10 2011-11 2011-12 2012-02 2012-03 2012-04 2012-05 2012-06 2012-07 2012-08 2012-09 2012-10 2012-11
10 22 10 12 36 31 25 19 7 7 7 5 1 9 9 11 10 16 25 3 2 5
缺少 2012 年 1 月并在 2012 年 11 月结束的观察结果,尽管它应该 运行 2013 年 12 月。
getCounts 使用命令
with(myDF, tapply(varName, substr(dateName, 1, 7), sum))
获取每月计数。
我想用 NA 替换时间序列中间和末尾缺失的观察值,这样我所有的时间序列都有相同数量的观察值,如果有 "holes" 它们将在图中可见。
谁能帮我做这个?
谢谢!
编辑:我的首选输出是这样的:
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2011 1 NA 2 3 4 5 6 NA 7 8 9 10
2012 2 3 4 5 6 NA NA NA NA NA NA NA
其中每个 NA 都在替换一个缺失的观察值。
编辑 2:getCounts() 看起来像这样:
getCounts <- function(dataObject, dateName, varName){
dataNameString <- deparse(substitute(dataObject))
countsStr <- paste0("with(", dataNameString,", tapply(", varName, ", substr(", dateName, ", 1, 7), sum))")
counts <- eval(parse(text = countsStr))
return(counts)
}
这是输出:
structure(c(10, 22, 10, 12, 36, 31, 25, 19, 7, 7, 7, 5, 1, 9,
9, 11, 10, 16, 25, 3, 2, 5), .Dim = 22L, .Dimnames = list(c("2011-01",
"2011-02", "2011-03", "2011-04", "2011-05", "2011-06", "2011-07",
"2011-08", "2011-09", "2011-10", "2011-11", "2011-12", "2012-02",
"2012-03", "2012-04", "2012-05", "2012-06", "2012-07", "2012-08",
"2012-09", "2012-10", "2012-11")))
试试这个
df <- data.frame(Year = substr(names(x), 1, 4),
Month = factor(month.abb[as.numeric(substr(names(x), 6, 7))],
levels = month.abb),
Value = x)
library(tidyr)
spread(df, Month, Value)
# Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
# 1 2011 10 22 10 12 36 31 25 19 7 7 7 5
# 2 2012 NA 1 9 9 11 10 16 25 3 2 5 NA
数据
x <- structure(c(10, 22, 10, 12, 36, 31, 25, 19, 7, 7, 7, 5, 1, 9,
9, 11, 10, 16, 25, 3, 2, 5), .Dim = 22L, .Dimnames = list(c("2011-01",
"2011-02", "2011-03", "2011-04", "2011-05", "2011-06", "2011-07",
"2011-08", "2011-09", "2011-10", "2011-11", "2011-12", "2012-02",
"2012-03", "2012-04", "2012-05", "2012-06", "2012-07", "2012-08",
"2012-09", "2012-10", "2012-11")))
我有一组 24 个分组(分层)时间序列,据说 运行 超过 3 年,我想查看每月销售额,但事实证明其中一些缺少观察值,例如
getCounts(Shop1, ...)
2011-01 2011-02 2011-03 2011-04 2011-05 2011-06 2011-07 2011-08 2011-09 2011-10 2011-11 2011-12 2012-02 2012-03 2012-04 2012-05 2012-06 2012-07 2012-08 2012-09 2012-10 2012-11
10 22 10 12 36 31 25 19 7 7 7 5 1 9 9 11 10 16 25 3 2 5
缺少 2012 年 1 月并在 2012 年 11 月结束的观察结果,尽管它应该 运行 2013 年 12 月。
getCounts 使用命令
with(myDF, tapply(varName, substr(dateName, 1, 7), sum))
获取每月计数。
我想用 NA 替换时间序列中间和末尾缺失的观察值,这样我所有的时间序列都有相同数量的观察值,如果有 "holes" 它们将在图中可见。
谁能帮我做这个?
谢谢!
编辑:我的首选输出是这样的:
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2011 1 NA 2 3 4 5 6 NA 7 8 9 10
2012 2 3 4 5 6 NA NA NA NA NA NA NA
其中每个 NA 都在替换一个缺失的观察值。
编辑 2:getCounts() 看起来像这样:
getCounts <- function(dataObject, dateName, varName){
dataNameString <- deparse(substitute(dataObject))
countsStr <- paste0("with(", dataNameString,", tapply(", varName, ", substr(", dateName, ", 1, 7), sum))")
counts <- eval(parse(text = countsStr))
return(counts)
}
这是输出:
structure(c(10, 22, 10, 12, 36, 31, 25, 19, 7, 7, 7, 5, 1, 9,
9, 11, 10, 16, 25, 3, 2, 5), .Dim = 22L, .Dimnames = list(c("2011-01",
"2011-02", "2011-03", "2011-04", "2011-05", "2011-06", "2011-07",
"2011-08", "2011-09", "2011-10", "2011-11", "2011-12", "2012-02",
"2012-03", "2012-04", "2012-05", "2012-06", "2012-07", "2012-08",
"2012-09", "2012-10", "2012-11")))
试试这个
df <- data.frame(Year = substr(names(x), 1, 4),
Month = factor(month.abb[as.numeric(substr(names(x), 6, 7))],
levels = month.abb),
Value = x)
library(tidyr)
spread(df, Month, Value)
# Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
# 1 2011 10 22 10 12 36 31 25 19 7 7 7 5
# 2 2012 NA 1 9 9 11 10 16 25 3 2 5 NA
数据
x <- structure(c(10, 22, 10, 12, 36, 31, 25, 19, 7, 7, 7, 5, 1, 9,
9, 11, 10, 16, 25, 3, 2, 5), .Dim = 22L, .Dimnames = list(c("2011-01",
"2011-02", "2011-03", "2011-04", "2011-05", "2011-06", "2011-07",
"2011-08", "2011-09", "2011-10", "2011-11", "2011-12", "2012-02",
"2012-03", "2012-04", "2012-05", "2012-06", "2012-07", "2012-08",
"2012-09", "2012-10", "2012-11")))