R 中的正则表达式名称和分组？

Question

我有这个数据框：

id <- c(0,1,2,3,4)
groupA_sample1_values <- c(10,11,12,13,14)
groupA_sample2_values <- c(20,21,22,23,24)
groupA_sample3_values <- c(30,31,32,33,34)
groupB_sample1_values <- c(40,41,42,43,44)
groupB_sample2_values <- c(50,51,52,53,54)
groupB_sample3_values <- c(60,61,62,63,64)

df <- data.frame(id, 
                 groupA_sample1_values,
                 groupA_sample2_values,
                 groupA_sample3_values,
                 groupB_sample1_values,
                 groupB_sample2_values,
                 groupB_sample3_values)

df

我正在尝试使用这些列获得另一个 table： ID、组、样本、值。我相信我必须使用正则表达式提取名称 groupA/groupB，样本编号也是如此，并将其融合到一个新的数据框，但我不确定如何处理它。有帮助吗？

Answer 1

尝试

library( tidyverse )
df %>%
  pivot_longer( -id,
                names_to = c("group", "sample" ),
                names_pattern = "group(.)_sample(.)_values",
                values_to = "value" )

# # A tibble: 30 x 4
#      id group sample value
#   <dbl> <chr> <chr>  <dbl>
# 1     0 A     1         10
# 2     0 A     2         20
# 3     0 A     3         30
# 4     0 B     1         40
# 5     0 B     2         50
# 6     0 B     3         60
# 7     1 A     1         11
# 8     1 A     2         21
# 9     1 A     3         31
#10     1 B     1         41

R 中的正则表达式名称和分组？

Regex colnames and grouping in R?

r

reshape

dataframe

melt