在列标题和成对变量中嵌入数据的数据透视表 table

Pivot table with embedded data in column headings and paired variables

假设我有这样的数据,不幸的是,变量值嵌入在列名中:

library(tidyr)
library(dplyr)
dat <- tribble(
  ~group, ~var1, ~var_meta1, ~var2, ~var_meta2,
  "group1", 5.2, "cat", 4.3, "dog"
)
dat
#> # A tibble: 1 x 5
#>   group   var1 var_meta1  var2 var_meta2
#>   <chr>  <dbl> <chr>     <dbl> <chr>    
#> 1 group1   5.2 cat         4.3 dog

我想将该数据转换为该数据,以便列名称中的数字成为一个变量。同时我想保持配对变量(var*var_meta*)之间的关系。

#> # A tibble: 2 x 4
#>   group    day   var var_meta
#>   <chr>  <dbl> <dbl> <chr>   
#> 1 group1     1   5.2 cat     
#> 2 group1     2   4.3 dog

对于这种特殊情况,我真的只对 tidyr 解决方案感兴趣。我试过这个:

dat %>%
  pivot_longer(-group,
    names_to = c("day", "var", ".value"),
    names_pattern = "([A-Za-z]+)_([A-Za-z]+)([0-9]+)"
  )
#> # A tibble: 3 x 5
#>   group  day   var   `1`   `2`  
#>   <chr>  <chr> <chr> <chr> <chr>
#> 1 group1 <NA>  <NA>  <NA>  <NA> 
#> 2 group1 var   meta  cat   dog  
#> 3 group1 <NA>  <NA>  <NA>  <NA>

还有这个:

dat %>%
  mutate(across(contains("var"), as.character)) %>%
  pivot_longer(-group,
    names_to = c("type", ".value"),
    names_pattern = "([A-Za-z]+)([0-9]+)"
  )
#> # A tibble: 2 x 4
#>   group  type  `1`   `2`  
#>   <chr>  <chr> <chr> <chr>
#> 1 group1 var   5.2   4.3  
#> 2 group1 meta  cat   dog

我觉得我很接近,但我不能完全理解正则表达式(我认为)。

有什么想法吗?

一个选项可以是:

dat %>%
 pivot_longer(-group,
              names_to = c(".value", "day"),
              names_pattern = "(\D+)(\d+)")

  group  day     var var_meta
  <chr>  <chr> <dbl> <chr>   
1 group1 1       5.2 cat     
2 group1 2       4.3 dog

我们还可以使用 names_sep 和正则表达式环视来拆分非数字 (\D) 和数字 (\d)

library(dplyr)
library(tidyr)
dat %>%
  pivot_longer(-group,
            names_to = c(".value", "day"),
           names_sep = "(?<=\D)(?=\d)")

-输出

# A tibble: 2 x 4
#  group  day     var var_meta
#  <chr>  <chr> <dbl> <chr>   
#1 group1 1       5.2 cat     
#2 group1 2       4.3 dog     

使用 reshape

的基础 R 选项
reshape(
  setNames(dat, gsub("(\d+)$", ".\1", names(dat))),
  direction = "long",
  idvar = "group",
  varying = -1,
  timevar = "day"
)