用序列替换值之间的 NA

Replace NAs between Values with Sequence

我有一个包含 NA 值的数据框。我想用 NA 前后值之间的序列替换这些 NA。

考虑以下示例:

# Example data
df <- data.frame(x1 = c(5, NA, NA, 10, NA),
                 x2 = c(NA, 2, NA, - 10, NA),
                 x3 = c(10, NA, 15, NA, 20))
df
# x1  x2 x3
#  5  NA 10
# NA   2 NA
# NA  NA 15
# 10 -10 NA
# NA  NA 20

两个值之间的 NA 应替换为序列。开头或结尾的 NA 应保持 NA:

# Expected output

#       x1   x2     x3
#        5   NA     10
# 6.666667    2   12.5
# 8.333333   -4     15
#       10  -10   17.5
#       NA   NA     20

如何自动替换两个值之间的 NA?

zoo 中的 na.approx 函数可以很容易地完成此插值。

df <- data.frame(x1 = c(5, NA, NA, 10, NA),
                 x2 = c(NA, 2, NA, - 10, NA),
                 x3 = c(10, NA, 15, NA, 20))
df
#>   x1  x2 x3
#> 1  5  NA 10
#> 2 NA   2 NA
#> 3 NA  NA 15
#> 4 10 -10 NA
#> 5 NA  NA 20

zoo::na.approx(df)
#>             x1  x2   x3
#> [1,]  5.000000  NA 10.0
#> [2,]  6.666667   2 12.5
#> [3,]  8.333333  -4 15.0
#> [4,] 10.000000 -10 17.5
#> [5,]        NA  NA 20.0

reprex package (v0.2.0) 创建于 2019-02-10。

这是一个使用 imputeTS 包的解决方案:

# Example data
df <- data.frame(x1 = c(5, NA, NA, 10, NA),
             x2 = c(NA, 2, NA, - 10, NA),
             x3 = c(10, NA, 15, NA, 20))

library("imputeTS")
na.interpolation(df, option = "linear)

对于imputeTS::na.interpolation,您可以通过参数选项(option = "spline" 或option = "stine")选择不同的插值方法。