在 R Shiny 中操作 textInput
Manipulating textInput in R Shiny
我对 R 比较陌生,对 Shiny 更陌生(实际上是第一天)。
我希望用户输入多个用逗号分隔的短语,例如 female, aged, diabetes mellitus.
我有一个数据框,其中一个变量 MH2
包含文本单词。我想输出一个仅包含所有输入短语都存在的行的数据框。有时用户可能只输入一个词组,有时是 5 个。
这是我的ui.R
library(shiny)
library(stringr)
# load dataset
load(file = "./data/all_cardiovascular_case_reports.Rdata")
ui <- fluidPage(
sidebarLayout(
sidebarPanel(
textInput(inputId = "phrases",
label = "Please enter all the MeSH terms that you would like to search, each separated by a comma:",
value = ""),
helpText("Example: female, aged, diabetes mellitus")
),
mainPanel(DT::dataTableOutput("dataframe"))
)
)
这是我的 server.R
library(shiny)
server <- function(input, output)
{
# where all the code will go
df <- reactive({
# counts how many phrases there are
num_phrases <- str_count(input$phrases, pattern = ", ") + 1
a <- numeric(num_phrases) # initialize vector to hold all phrases
# create vector of all entered phrases
for (i in 1:num_phrases)
{
a[i] <- noquote(strsplit(input$phrases, ", ")[[i]][1])
}
# make all phrases lowercase
a <- tolower(a)
# do exact case match so that each phrase is bound by "\b"
a <- paste0("\b", a, sep = "")
exact <- "\b"
a <- paste0(a, exact, sep = "")
# subset dataframe over and over again until all phrases used
for (i in 1:num_phrases)
{
final <- final[grepl(pattern = a, x = final$MH2, ignore.case = TRUE), ]
}
return(final)
})
output$dataframe <- DT::renderDataTable({df()})
}
当我尝试 运行ning renderText({num_phrases})
时,我总是得到 1
,即使我输入多个用逗号分隔的短语也是如此。从那以后,每当我尝试输入多个短语时,我都会 运行 进入 "error: subscript out of bounds." 但是,当我输入仅用逗号分隔的单词与逗号和 space (输入 "female,aged" 而不是 "female, aged") 那么这个问题就消失了,但是我的数据框没有正确地子集化。它只能子集一个短语。
请指教
谢谢。
我认为您的 Shiny 逻辑看起来不错,但是对数据框进行子集化的功能存在一些小问题。特别是:
a[i] <- noquote(strsplit(input$phrases, ", ")[[i]][1])
索引[[i]]
和1
放错地方了,应该是[[1]][i]
final <- final[grepl(pattern = a, x = final$MH2, ignore.case = TRUE), ]
你不能像这样匹配多个模式,只会使用a的第一个元素,这也是R给出的警告。
示例工作代码
这里我把input$phrases
改成了inp_phrases
。如果这个脚本做了你想要的,我想你可以很容易地将它复制到你的反应中,进行必要的更改(即改变 inp_phrases
回来,并添加 return(result)
语句。)。如果您希望所有模式都在一行中匹配,或者 return 所有行都匹配了任何模式,我也不完全清楚,所以我将它们都添加了,您可以取消注释您需要的那个:
library(stringr)
# some example data
inp_phrases = "ab, cd"
final = data.frame(index = c(1,2,3,4),MH2 = c("ab cd ef","ab ef","cd ef ab","ef gx"),stringsAsFactors = F)
# this could become just two lines:
a <- sapply(strsplit(inp_phrases, ", ")[[1]], function(x) tolower(noquote(x)))
a <- paste0("\b", a, "\b")
# Two options here, uncomment the one you need.
# Top one: match any pattern in a. Bottom: match all patterns in a
# indices = grepl(pattern = paste(a,collapse="|"), x = final$MH2, ignore.case = TRUE)
indices = colSums(do.call(rbind,lapply(a, function(x) grepl(pattern = x, x = final$MH2, ignore.case = TRUE))))==length(a)
result <- final[indices,]
Returns:
index MH2
1 1 ab cd ef
3 3 cd ef ab
...与索引的第二个版本(全部匹配)或
index MH2
1 1 ab cd ef
2 2 ab ef
3 3 cd ef ab
...第一个版本的索引(匹配任何)
希望对您有所帮助!
我对 R 比较陌生,对 Shiny 更陌生(实际上是第一天)。
我希望用户输入多个用逗号分隔的短语,例如 female, aged, diabetes mellitus.
我有一个数据框,其中一个变量 MH2
包含文本单词。我想输出一个仅包含所有输入短语都存在的行的数据框。有时用户可能只输入一个词组,有时是 5 个。
这是我的ui.R
library(shiny)
library(stringr)
# load dataset
load(file = "./data/all_cardiovascular_case_reports.Rdata")
ui <- fluidPage(
sidebarLayout(
sidebarPanel(
textInput(inputId = "phrases",
label = "Please enter all the MeSH terms that you would like to search, each separated by a comma:",
value = ""),
helpText("Example: female, aged, diabetes mellitus")
),
mainPanel(DT::dataTableOutput("dataframe"))
)
)
这是我的 server.R
library(shiny)
server <- function(input, output)
{
# where all the code will go
df <- reactive({
# counts how many phrases there are
num_phrases <- str_count(input$phrases, pattern = ", ") + 1
a <- numeric(num_phrases) # initialize vector to hold all phrases
# create vector of all entered phrases
for (i in 1:num_phrases)
{
a[i] <- noquote(strsplit(input$phrases, ", ")[[i]][1])
}
# make all phrases lowercase
a <- tolower(a)
# do exact case match so that each phrase is bound by "\b"
a <- paste0("\b", a, sep = "")
exact <- "\b"
a <- paste0(a, exact, sep = "")
# subset dataframe over and over again until all phrases used
for (i in 1:num_phrases)
{
final <- final[grepl(pattern = a, x = final$MH2, ignore.case = TRUE), ]
}
return(final)
})
output$dataframe <- DT::renderDataTable({df()})
}
当我尝试 运行ning renderText({num_phrases})
时,我总是得到 1
,即使我输入多个用逗号分隔的短语也是如此。从那以后,每当我尝试输入多个短语时,我都会 运行 进入 "error: subscript out of bounds." 但是,当我输入仅用逗号分隔的单词与逗号和 space (输入 "female,aged" 而不是 "female, aged") 那么这个问题就消失了,但是我的数据框没有正确地子集化。它只能子集一个短语。
请指教
谢谢。
我认为您的 Shiny 逻辑看起来不错,但是对数据框进行子集化的功能存在一些小问题。特别是:
a[i] <- noquote(strsplit(input$phrases, ", ")[[i]][1])
索引[[i]]
和1
放错地方了,应该是[[1]][i]
final <- final[grepl(pattern = a, x = final$MH2, ignore.case = TRUE), ]
你不能像这样匹配多个模式,只会使用a的第一个元素,这也是R给出的警告。
示例工作代码
这里我把input$phrases
改成了inp_phrases
。如果这个脚本做了你想要的,我想你可以很容易地将它复制到你的反应中,进行必要的更改(即改变 inp_phrases
回来,并添加 return(result)
语句。)。如果您希望所有模式都在一行中匹配,或者 return 所有行都匹配了任何模式,我也不完全清楚,所以我将它们都添加了,您可以取消注释您需要的那个:
library(stringr)
# some example data
inp_phrases = "ab, cd"
final = data.frame(index = c(1,2,3,4),MH2 = c("ab cd ef","ab ef","cd ef ab","ef gx"),stringsAsFactors = F)
# this could become just two lines:
a <- sapply(strsplit(inp_phrases, ", ")[[1]], function(x) tolower(noquote(x)))
a <- paste0("\b", a, "\b")
# Two options here, uncomment the one you need.
# Top one: match any pattern in a. Bottom: match all patterns in a
# indices = grepl(pattern = paste(a,collapse="|"), x = final$MH2, ignore.case = TRUE)
indices = colSums(do.call(rbind,lapply(a, function(x) grepl(pattern = x, x = final$MH2, ignore.case = TRUE))))==length(a)
result <- final[indices,]
Returns:
index MH2
1 1 ab cd ef
3 3 cd ef ab
...与索引的第二个版本(全部匹配)或
index MH2
1 1 ab cd ef
2 2 ab ef
3 3 cd ef ab
...第一个版本的索引(匹配任何)
希望对您有所帮助!