根据id提取可达行

Question

我正在尝试编写一个 function，它将 return 所有与该 ID 相关的行。

输入数据：

df <- data.frame(
         id1=c('A1','A1','B1','B2','C2','C3','B3','D1','D2','E1'),
         id2=c('P1','P2','P1','P2','P1','KK3','KK3','DL5','FD7','LO6')
      )

例如

sample_rows <- function(id1){

  #code here 
  return(output)
}

期望输出 1：

sample_rows(id1='A1') 应该 return 以下数据框：

期望输出 2：

sample_rows(id1 = 'C3') 应该 return 以下数据框：

  id1    id2
  C3     KK3
  B3     KK3

Answer 1

利用 igraph 和 dplyr 的一个解决方案可能是：

fun <- function(data, id1) {
 data %>%
  left_join(stack(clusters(graph.data.frame(data))$membership),
           by = c("id2" = "ind")) %>%
 filter(values == values[id1 == !!id1])
}

fun(df, "A1")

  id1 id2 common_id
1  A1  P1         1
2  A1  P2         1
3  B1  P1         1
4  B2  P2         1
5  C2  P1         1

或者：

fun <- function(data, id1) {
 clust <- clusters(graph.data.frame(data))$membership
 data %>%
  mutate(common_id = clust[match(id2, names(clust))]) %>%
  filter(common_id == common_id[id1 == !!id1])
}

Answer 2

不要使用 sample 作为函数名，你可能会覆盖 R 自己的函数

base R解决办法：

my_fun <- function(id1) {
  id2s <- df[df$id1 == id1, 'id2']
  df[df$id2 %in% id2s,]
}

my_fun(id1 = 'A1')
#>   id1 id2
#> 1  A1  P1
#> 2  A1  P2
#> 3  B1  P1
#> 4  B2  P2
#> 5  C2  P1

my_fun(id1 = 'C3')
#>   id1 id2
#> 6  C3 KK3
#> 7  B3 KK3

dplyr解法：

library(dplyr)

my_dplyr_fun <- function(data, id1) {
  id2s <- filter(data, id1 == {{id1}}) %>% 
    pull(id2)
  data %>%
    filter(id2 %in% id2s)
}

df %>% 
  my_dplyr_fun('C3')
#>   id1 id2
#> 1  C3 KK3
#> 2  B3 KK3

^{由 reprex package (v0.3.0)}

于 2020-04-03 创建

根据id提取可达行

Extract reachable rows based on id

r

dplyr

data.table

tidyverse

plyr