Dplyr select_ 和 starts_with 变量列表第 2 部分中的多个值
Dplyr select_ and starts_with on multiple values in a variable list part 2
这是我之前问题的延续:
我正在从不同位置的不同传感器收集数据,数据输出类似于:
df<-data.frame(date=c(2011,2012,2013,2014,2015),"Sensor1 Temp"=c(15,18,15,14,19),"Sensor1 Pressure"=c(1001, 1000, 1002, 1004, 1000),"Sensor1a Temp"=c(15,18,15,14,19),"Sensor1a Pressure"=c(1001, 1000, 1002, 1004, 1000), "Sensor2 Temp"=c(15,18,15,14,19),"Sensor2 Pressure"=c(1001, 1000, 1002, 1004, 1000), "Sensor2 DewPoint"=c(10,11,10,9,12),"Sensor2 Humidity"=c(90, 100, 90, 100, 80))
问题是(我认为)类似于:Using select_ and starts_with R
或者
我想按位置搜索传感器,所以我有一个列表来搜索数据框,还包括时间戳。但是,当我搜索多个传感器(或传感器类型等)时,搜索就会失败。有没有办法使用 dplyr(NSE 或 SE)来实现这一点?
FindLocation = c("date", "Sensor1", "Sensor2")
df %>% select(matches(paste(FindLocation, collapse="|"))) # works but picks up "Sensor1a" and "DewPoint" and "Humidity" data from Sensor2
我还想添加混合搜索,例如:
FindLocation = c("Sensor1", "Sensor2") # without selecting "Sensor1a"
FindSensor = c("Temp", "Pressure") # without selecting "DewPoint" or "Humidity"
我希望 select 将 FindSensor 与 FindLocation 以及 Sensor1 和 Sensor2 的 selects 温度和压力数据结合起来(没有 selecting Sensor1a)。返回包含数据和列标题的数据框:
日期、传感器 1 温度、传感器 1 压力、传感器 2 温度、传感器 2 压力
再次感谢!
像这样的事情怎么样:
library(tidyverse)
wich_col <- df %>% names %>% strsplit("[.]") %>% map_lgl(function(x)x[1]%in%FindLocation&x[2]%in%FindSensor)
df[wich_col]
?
purrr
中的一些函数将会很有用。首先,您使用 cross2
计算 FindLocation
和 FindSensor
的笛卡尔积。你会得到一个配对列表。然后使用 map_chr
将 paste
应用到它们,用点 (.
) 连接位置和传感器字符串。然后你使用 one_of
助手来 select 列。
library(purrr)
FindLocation = c("Sensor1", "Sensor2")
FindSensor = c("Temp", "Pressure")
columns = cross2(FindLocation, FindSensor) %>%
map_chr(paste, collapse = ".")
df %>% select(one_of(columns))
我们可以使用
df %>%
select(matches(paste(c("date", outer(FindLocation,
FindSensor, paste, sep=".")), collapse="|")))
这是我之前问题的延续:
我正在从不同位置的不同传感器收集数据,数据输出类似于:
df<-data.frame(date=c(2011,2012,2013,2014,2015),"Sensor1 Temp"=c(15,18,15,14,19),"Sensor1 Pressure"=c(1001, 1000, 1002, 1004, 1000),"Sensor1a Temp"=c(15,18,15,14,19),"Sensor1a Pressure"=c(1001, 1000, 1002, 1004, 1000), "Sensor2 Temp"=c(15,18,15,14,19),"Sensor2 Pressure"=c(1001, 1000, 1002, 1004, 1000), "Sensor2 DewPoint"=c(10,11,10,9,12),"Sensor2 Humidity"=c(90, 100, 90, 100, 80))
问题是(我认为)类似于:Using select_ and starts_with R
或者
我想按位置搜索传感器,所以我有一个列表来搜索数据框,还包括时间戳。但是,当我搜索多个传感器(或传感器类型等)时,搜索就会失败。有没有办法使用 dplyr(NSE 或 SE)来实现这一点?
FindLocation = c("date", "Sensor1", "Sensor2")
df %>% select(matches(paste(FindLocation, collapse="|"))) # works but picks up "Sensor1a" and "DewPoint" and "Humidity" data from Sensor2
我还想添加混合搜索,例如:
FindLocation = c("Sensor1", "Sensor2") # without selecting "Sensor1a"
FindSensor = c("Temp", "Pressure") # without selecting "DewPoint" or "Humidity"
我希望 select 将 FindSensor 与 FindLocation 以及 Sensor1 和 Sensor2 的 selects 温度和压力数据结合起来(没有 selecting Sensor1a)。返回包含数据和列标题的数据框:
日期、传感器 1 温度、传感器 1 压力、传感器 2 温度、传感器 2 压力
再次感谢!
像这样的事情怎么样:
library(tidyverse)
wich_col <- df %>% names %>% strsplit("[.]") %>% map_lgl(function(x)x[1]%in%FindLocation&x[2]%in%FindSensor)
df[wich_col]
?
purrr
中的一些函数将会很有用。首先,您使用 cross2
计算 FindLocation
和 FindSensor
的笛卡尔积。你会得到一个配对列表。然后使用 map_chr
将 paste
应用到它们,用点 (.
) 连接位置和传感器字符串。然后你使用 one_of
助手来 select 列。
library(purrr)
FindLocation = c("Sensor1", "Sensor2")
FindSensor = c("Temp", "Pressure")
columns = cross2(FindLocation, FindSensor) %>%
map_chr(paste, collapse = ".")
df %>% select(one_of(columns))
我们可以使用
df %>%
select(matches(paste(c("date", outer(FindLocation,
FindSensor, paste, sep=".")), collapse="|")))