警告:因子包含隐式 NA
Warning: Factor contains implicit NA
我是 R 和 Shiny 的新手,我正在尝试使用 ggplot2 创建交互式绘图。当用户选中复选框时,他可以访问多个 select 字段来自定义绘图。
原始数据框包含 Publisher
和 Year
列中标识为 "N/A"
的缺失值。我用 complete.cases
删除了包含 NA 的行,所以它不应该留下任何 NA。
我 运行 我的应用程序:好的。我进入默认情节:好的。我选中复选框:Warning: Factor 'Publisher' contains implicit NA, consider using 'forcats::fct_explicit_na'
我想删除这个警告,至少理解它。如果您有任何其他评论,请发表评论:我的目标是变得更好。
app.R :
df<-read.csv("vgsales.csv")
df$Year[df$Year=="N/A"]<-NA
df$Year<-factor(df$Year)
df$Publisher[df$Publisher=="N/A"]<-NA
df$Publisher<-factor(df$Publisher)
df<-df[complete.cases(df),]
pubSales<-na.omit(df
%>% group_by(Publisher, Year)
%>% summarise(Global_Sales=sum(Global_Sales))
)
pubSales<-pubSales[order(pubSales$Year),]
top5Pub<-head(unique(pubSales[order(-pubSales$Global_Sales),]$Publisher),5)
ui <- navbarPage("Video Games Sales",
tabPanel("Publishers",
mainPanel(
titlePanel(
title = "Publishers sales"
),
sidebarPanel(
radioButtons(
"pubOptions",
"Options",
c("Top 5 Publishers"="topFivePub",
"Custom Publishers"="customPub"),
selected="topFivePub"
),
uiOutput("customPubUI")
),
mainPanel(
plotOutput("pubPlot")
),
width=12
)
)
)
server <- function(input, output, session) {
output$customPubUI<-renderUI({
if(input$pubOptions=="customPub"){
selectInput(
"selectedPub",
"Editeurs",
pubSales$Publisher,
multiple=TRUE
)
}
})
output$pubSales<-renderTable(pubSales)
output$pubPlot<-renderPlot({
ggplot()+
if(input$pubOptions=="customPub"){
geom_line(
data=pubSales[pubSales$Publisher %in% input$selectedPub,],
aes(x=Year,y=Global_Sales,colour=Publisher,group=Publisher)
)
}else{
geom_line(
data=pubSales[pubSales$Publisher %in% top5Pub,],
aes(x=Year,y=Global_Sales,colour=Publisher,group=Publisher)
)
}
})
}
shinyApp(ui, server)
与:
require(shiny)
require(tidyverse)
# Create some sample data:
year <- rep(2000:2018, each=3)
publ <- rep(strrep(c("Pub 1", "Pub2", "pub3"), 1), 19)
Global_Sales <- rep(sample(1:100,19),3)
# Create a observation with NA:
newline <- c(NA, NA, 33)
df <- data.frame(Year = year, Publisher = publ, Global_Sales = Global_Sales)
df <- rbind(df,newline)
df <- na.omit(df)
pubSales<-df %>% group_by(Publisher, Year) %>%
summarise(Global_Sales=sum(Global_Sales))
pubSales$Publisher <- as.character(pubSales$Publisher)
错误不再出现。只要您在 shiny 中使用的数据不包含因子(这是 "implicit NA" 的来源),该错误就不会出现在我的样本数据中。
弹出警告是因为 NA 不是因子中的水平。它只是不见了。该警告提醒您,因子中有一个 "hidden" 级别,当您对该因子执行操作时,该级别不会显示。
例如一个基本因素:
a.factor <- as.factor(c('a', 'b', 'c', NA))
打印或快速总结时只有 3 个级别 table:
> print(a.factor)
[1] a b c <NA>
Levels: a b c
> table(a.factor)
a.factor
a b c
1 1 1
如果您的数据框包含未使用的因子水平,我使用
pubSales <- droplevels(pubSales)
这为我删除了未使用的级别和错误。
我是 R 和 Shiny 的新手,我正在尝试使用 ggplot2 创建交互式绘图。当用户选中复选框时,他可以访问多个 select 字段来自定义绘图。
原始数据框包含 Publisher
和 Year
列中标识为 "N/A"
的缺失值。我用 complete.cases
删除了包含 NA 的行,所以它不应该留下任何 NA。
我 运行 我的应用程序:好的。我进入默认情节:好的。我选中复选框:Warning: Factor 'Publisher' contains implicit NA, consider using 'forcats::fct_explicit_na'
我想删除这个警告,至少理解它。如果您有任何其他评论,请发表评论:我的目标是变得更好。
app.R :
df<-read.csv("vgsales.csv")
df$Year[df$Year=="N/A"]<-NA
df$Year<-factor(df$Year)
df$Publisher[df$Publisher=="N/A"]<-NA
df$Publisher<-factor(df$Publisher)
df<-df[complete.cases(df),]
pubSales<-na.omit(df
%>% group_by(Publisher, Year)
%>% summarise(Global_Sales=sum(Global_Sales))
)
pubSales<-pubSales[order(pubSales$Year),]
top5Pub<-head(unique(pubSales[order(-pubSales$Global_Sales),]$Publisher),5)
ui <- navbarPage("Video Games Sales",
tabPanel("Publishers",
mainPanel(
titlePanel(
title = "Publishers sales"
),
sidebarPanel(
radioButtons(
"pubOptions",
"Options",
c("Top 5 Publishers"="topFivePub",
"Custom Publishers"="customPub"),
selected="topFivePub"
),
uiOutput("customPubUI")
),
mainPanel(
plotOutput("pubPlot")
),
width=12
)
)
)
server <- function(input, output, session) {
output$customPubUI<-renderUI({
if(input$pubOptions=="customPub"){
selectInput(
"selectedPub",
"Editeurs",
pubSales$Publisher,
multiple=TRUE
)
}
})
output$pubSales<-renderTable(pubSales)
output$pubPlot<-renderPlot({
ggplot()+
if(input$pubOptions=="customPub"){
geom_line(
data=pubSales[pubSales$Publisher %in% input$selectedPub,],
aes(x=Year,y=Global_Sales,colour=Publisher,group=Publisher)
)
}else{
geom_line(
data=pubSales[pubSales$Publisher %in% top5Pub,],
aes(x=Year,y=Global_Sales,colour=Publisher,group=Publisher)
)
}
})
}
shinyApp(ui, server)
与:
require(shiny)
require(tidyverse)
# Create some sample data:
year <- rep(2000:2018, each=3)
publ <- rep(strrep(c("Pub 1", "Pub2", "pub3"), 1), 19)
Global_Sales <- rep(sample(1:100,19),3)
# Create a observation with NA:
newline <- c(NA, NA, 33)
df <- data.frame(Year = year, Publisher = publ, Global_Sales = Global_Sales)
df <- rbind(df,newline)
df <- na.omit(df)
pubSales<-df %>% group_by(Publisher, Year) %>%
summarise(Global_Sales=sum(Global_Sales))
pubSales$Publisher <- as.character(pubSales$Publisher)
错误不再出现。只要您在 shiny 中使用的数据不包含因子(这是 "implicit NA" 的来源),该错误就不会出现在我的样本数据中。
弹出警告是因为 NA 不是因子中的水平。它只是不见了。该警告提醒您,因子中有一个 "hidden" 级别,当您对该因子执行操作时,该级别不会显示。
例如一个基本因素:
a.factor <- as.factor(c('a', 'b', 'c', NA))
打印或快速总结时只有 3 个级别 table:
> print(a.factor)
[1] a b c <NA>
Levels: a b c
> table(a.factor)
a.factor
a b c
1 1 1
如果您的数据框包含未使用的因子水平,我使用
pubSales <- droplevels(pubSales)
这为我删除了未使用的级别和错误。