为什么排序的数据框在绘图时会重新排列?
Why does the sorted dataframe rearrange when plotting?
最初数据框 df 已排序,我假设它是一个字符串,但能够对字母数字向量进行排序:
df <- df[mixedorder(as.character(df$ID)),]
创建条形图时,(x 轴)顺序变回 1 10a 10b 11
,即使我明确将顺序更改为 1 2 3 4 5
你似乎在处理因子,或者一个字符向量,它在绘图时被强制转换为按字母顺序排序的因子,所以如果它还不是一个因子,你就把它变成一个因子,然后重新排列因子水平,而不是按 ID 对 data.frame 进行排序:
df <- data.frame(a=factor(as.character(c(1, 2, 3, 10, 11, 20, 21, 22))))
df <- data.frame(ID=factor(c("1", "2", "3", "4", "5", "10a", "10b", "11")),
y=c(seq(100,500,100), 150, 155, 180))
df <- df[order(df$ID), ]
df$ID
#> [1] 1 10a 10b 11 2 3 4 5
#> Levels: 1 10a 10b 11 2 3 4 5
df <- df[gtools::mixedorder(as.character(df$ID)),]
df$ID
#> [1] 1 2 3 4 5 10a 10b 11
#> Levels: 1 10a 10b 11 2 3 4 5
barplot(y~ID, data=df)
df$ID <- factor(df$ID, levels=levels(df$ID)[gtools::mixedorder(levels(df$ID))])
barplot(y~ID, data=df)
由 reprex package (v0.3.0)
于 2020-04-26 创建
- 编辑处理因素重新调平以解决引入的错误。
library(tidyverse)
df <- data.frame(ID=(c("1", "2", "3", "4", "5", "10a", "10b", "11")),
y=c(seq(100,500,100), 150, 155, 180), stringsAsFactors = FALSE)
简单数据的简单修复
df$numId<-1:nrow(df)
ggplot(df, aes(x=reorder(ID,numId), y = y)) +
geom_col() +
labs(x='ID', y='Value')
结果
创建一个函数来生成数值
create_id<-function(x) {
if(!grepl('[a-z]',x,ignore.case = TRUE)) {
return(as.numeric(x))
} else {
letter<-tolower(gsub('[0-9]+',"",x))
letter_value<-which(letters==letter)/100
number<-as.numeric(gsub('[a-z]',"",x)) + letter_value
return(number)
}
}
df<-df %>%
group_by(ID, y) %>%
mutate(nid = round(create_id(ID),3))
ggplot(df, aes(x=reorder(ID,nid), y = y)) +
geom_col() +
labs(x='ID', y='Value')
结果
感谢@user12728748 的回答以及提供数据框代码。我的回答只是为了满足问题中的ggplot2标签。上面的答案同样合适。
最初数据框 df 已排序,我假设它是一个字符串,但能够对字母数字向量进行排序:
df <- df[mixedorder(as.character(df$ID)),]
创建条形图时,(x 轴)顺序变回 1 10a 10b 11
,即使我明确将顺序更改为 1 2 3 4 5
你似乎在处理因子,或者一个字符向量,它在绘图时被强制转换为按字母顺序排序的因子,所以如果它还不是一个因子,你就把它变成一个因子,然后重新排列因子水平,而不是按 ID 对 data.frame 进行排序:
df <- data.frame(a=factor(as.character(c(1, 2, 3, 10, 11, 20, 21, 22))))
df <- data.frame(ID=factor(c("1", "2", "3", "4", "5", "10a", "10b", "11")),
y=c(seq(100,500,100), 150, 155, 180))
df <- df[order(df$ID), ]
df$ID
#> [1] 1 10a 10b 11 2 3 4 5
#> Levels: 1 10a 10b 11 2 3 4 5
df <- df[gtools::mixedorder(as.character(df$ID)),]
df$ID
#> [1] 1 2 3 4 5 10a 10b 11
#> Levels: 1 10a 10b 11 2 3 4 5
barplot(y~ID, data=df)
df$ID <- factor(df$ID, levels=levels(df$ID)[gtools::mixedorder(levels(df$ID))])
barplot(y~ID, data=df)
由 reprex package (v0.3.0)
于 2020-04-26 创建- 编辑处理因素重新调平以解决引入的错误。
library(tidyverse)
df <- data.frame(ID=(c("1", "2", "3", "4", "5", "10a", "10b", "11")),
y=c(seq(100,500,100), 150, 155, 180), stringsAsFactors = FALSE)
简单数据的简单修复
df$numId<-1:nrow(df)
ggplot(df, aes(x=reorder(ID,numId), y = y)) +
geom_col() +
labs(x='ID', y='Value')
结果
创建一个函数来生成数值
create_id<-function(x) {
if(!grepl('[a-z]',x,ignore.case = TRUE)) {
return(as.numeric(x))
} else {
letter<-tolower(gsub('[0-9]+',"",x))
letter_value<-which(letters==letter)/100
number<-as.numeric(gsub('[a-z]',"",x)) + letter_value
return(number)
}
}
df<-df %>%
group_by(ID, y) %>%
mutate(nid = round(create_id(ID),3))
ggplot(df, aes(x=reorder(ID,nid), y = y)) +
geom_col() +
labs(x='ID', y='Value')
结果
感谢@user12728748 的回答以及提供数据框代码。我的回答只是为了满足问题中的ggplot2标签。上面的答案同样合适。