运行 delta - 数据框行的滞后差异

Running delta - Lag difference over row of data frame

我有一个数据框,例如

df1 <- data.frame(Company = c('A','B','C','D','E'),
                  `X1980` = c(1, 5, 3, 8, 13),
                  `X1981` = c(20, 13, 23, 11, 29),
                  `X1982` = c(33, 32, 31, 41, 42),
                  `X1983` = c(45, 47, 53, 58, 55))

我想创建一个新的数据框 (df2),使公司列保持原样。 1980 年和 1983 年的值应使用当前值减去先前值来计算。所以基本上我想要一个导致滚动增量的数据框。

        Company  1980  1981  1982  1983
           A      NA    19    13    12
           B      NA    8     19    15
           C      NA    20    8     22
           D      NA    3     30    17
           E      NA    16    13    13

感谢您的帮助!如果我有任何改进问题的方法,请告诉我。

您可以在每行中找到差异,将 NA 添加到第一个值。

df1[-1] <- t(apply(df1[-1], 1, function(x) c(NA, diff(x))))
df1

#  Company X1980 X1981 X1982 X1983
#1       A    NA    19    13    12
#2       B    NA     8    19    15
#3       C    NA    20     8    22
#4       D    NA     3    30    17
#5       E    NA    16    13    13

您还可以使用 tidyverse 函数。

library(dplyr)
library(tidyr)

df1 %>%
  pivot_longer(cols = -Company) %>%
  group_by(Company) %>%
  mutate(value = value - lag(value)) %>%
  pivot_wider()

我们可以使用 matrixStats

中的 rowDiffs
library(matrixStats)
df1[-1] <-  cbind(NA, rowDiffs(as.matrix(df1[-1])))

-输出

df1
#  Company X1980 X1981 X1982 X1983
#1       A    NA    19    13    12
#2       B    NA     8    19    15
#3       C    NA    20     8    22
#4       D    NA     3    30    17
#5       E    NA    16    13    13