R 动物园包:na.approx 当 NA 位于开头时更改向量的长度
R zoo package: na.approx changing length of vector when NA are in the beginning
zoo 包具有函数 na.approx(或 na.spline),它用近似值或样条曲线替换数据中的 NA。
一个潜在的论点是 maxgap
,它给出了需要填补的最大空白。这工作正常,除了如果 NA 位于向量的开头,函数会更改向量的长度。
例如:
require(zoo)
x <- 1:20 + rnorm(20)
x1 <- x
x1[5] <- x1[6] <- NaN
length(na.approx(x1, maxgap = 1)) == length(x) # TRUE
x2 <- x
x2[1] <- x2[2] <- NaN
length(na.approx(x2, maxgap = 1)) == length(x) # FALSE
将此函数与数据框一起使用时会出现问题。例如:
require(dplyr)
df1 <- tibble(A = 1:20, B = x1)
df1 %>%
mutate(B_fill = na.approx(B, maxgap = 1))
df2 <- tibble(A = 1:20, B = x2)
df2 %>%
mutate(B_fill = na.approx(B, maxgap = 1))
# Error: Column `B_fill` must be length 20 (the number of rows) or one, not 18
当我问这个问题时,我找到了答案,只需更改 na.rm
参数即可。
df2 %>%
mutate(B_fill = na.approx(B, maxgap = 1, na.rm = FALSE))
zoo 包具有函数 na.approx(或 na.spline),它用近似值或样条曲线替换数据中的 NA。
一个潜在的论点是 maxgap
,它给出了需要填补的最大空白。这工作正常,除了如果 NA 位于向量的开头,函数会更改向量的长度。
例如:
require(zoo)
x <- 1:20 + rnorm(20)
x1 <- x
x1[5] <- x1[6] <- NaN
length(na.approx(x1, maxgap = 1)) == length(x) # TRUE
x2 <- x
x2[1] <- x2[2] <- NaN
length(na.approx(x2, maxgap = 1)) == length(x) # FALSE
将此函数与数据框一起使用时会出现问题。例如:
require(dplyr)
df1 <- tibble(A = 1:20, B = x1)
df1 %>%
mutate(B_fill = na.approx(B, maxgap = 1))
df2 <- tibble(A = 1:20, B = x2)
df2 %>%
mutate(B_fill = na.approx(B, maxgap = 1))
# Error: Column `B_fill` must be length 20 (the number of rows) or one, not 18
当我问这个问题时,我找到了答案,只需更改 na.rm
参数即可。
df2 %>%
mutate(B_fill = na.approx(B, maxgap = 1, na.rm = FALSE))