Dplyr select_ 和 starts_with 变量列表第 2 部分中的多个值

Dplyr select_ and starts_with on multiple values in a variable list part 2

这是我之前问题的延续:

我正在从不同位置的不同传感器收集数据,数据输出类似于:

df<-data.frame(date=c(2011,2012,2013,2014,2015),"Sensor1 Temp"=c(15,18,15,14,19),"Sensor1 Pressure"=c(1001, 1000, 1002, 1004, 1000),"Sensor1a Temp"=c(15,18,15,14,19),"Sensor1a Pressure"=c(1001, 1000, 1002, 1004, 1000), "Sensor2 Temp"=c(15,18,15,14,19),"Sensor2 Pressure"=c(1001, 1000, 1002, 1004, 1000), "Sensor2 DewPoint"=c(10,11,10,9,12),"Sensor2 Humidity"=c(90, 100, 90, 100, 80))

问题是(我认为)类似于:Using select_ and starts_with R 或者

我想按位置搜索传感器,所以我有一个列表来搜索数据框,还包括时间戳。但是,当我搜索多个传感器(或传感器类型等)时,搜索就会失败。有没有办法使用 dplyr(NSE 或 SE)来实现这一点?

FindLocation = c("date", "Sensor1", "Sensor2")
df %>% select(matches(paste(FindLocation, collapse="|"))) # works but picks up "Sensor1a" and "DewPoint" and "Humidity" data from Sensor2 

我还想添加混合搜索,例如:

 FindLocation = c("Sensor1", "Sensor2") # without selecting "Sensor1a"
 FindSensor = c("Temp", "Pressure") # without selecting "DewPoint" or "Humidity"

我希望 select 将 FindSensor 与 FindLocation 以及 Sensor1 和 Sensor2 的 selects 温度和压力数据结合起来(没有 selecting Sensor1a)。返回包含数据和列标题的数据框:

日期、传感器 1 温度、传感器 1 压力、传感器 2 温度、传感器 2 压力

再次感谢!

像这样的事情怎么样:

library(tidyverse)
wich_col <- df %>% names %>% strsplit("[.]") %>% map_lgl(function(x)x[1]%in%FindLocation&x[2]%in%FindSensor)
df[wich_col]

?

purrr 中的一些函数将会很有用。首先,您使用 cross2 计算 FindLocationFindSensor 的笛卡尔积。你会得到一个配对列表。然后使用 map_chrpaste 应用到它们,用点 (.) 连接位置和传感器字符串。然后你使用 one_of 助手来 select 列。

library(purrr)

FindLocation = c("Sensor1", "Sensor2")
FindSensor = c("Temp", "Pressure")

columns = cross2(FindLocation, FindSensor) %>%
  map_chr(paste, collapse = ".")

df %>% select(one_of(columns))

我们可以使用

df %>% 
  select(matches(paste(c("date", outer(FindLocation, 
                FindSensor, paste, sep=".")), collapse="|")))