为什么排序的数据框在绘图时会重新排列?

Why does the sorted dataframe rearrange when plotting?

最初数据框 df 已排序,我假设它是一个字符串,但能够对字母数字向量进行排序:

df <- df[mixedorder(as.character(df$ID)),]

创建条形图时,(x 轴)顺序变回 1 10a 10b 11,即使我明确将顺序更改为 1 2 3 4 5

你似乎在处理因子,或者一个字符向量,它在绘图时被强制转换为按字母顺序排序的因子,所以如果它还不是一个因子,你就把它变成一个因子,然后重新排列因子水平,而不是按 ID 对 data.frame 进行排序:

df <- data.frame(a=factor(as.character(c(1, 2, 3, 10, 11, 20, 21, 22))))
df <- data.frame(ID=factor(c("1", "2", "3", "4", "5", "10a", "10b", "11")), 
                 y=c(seq(100,500,100), 150, 155, 180))
df <- df[order(df$ID), ]
df$ID
#> [1] 1   10a 10b 11  2   3   4   5  
#> Levels: 1 10a 10b 11 2 3 4 5
df <- df[gtools::mixedorder(as.character(df$ID)),]
df$ID
#> [1] 1   2   3   4   5   10a 10b 11 
#> Levels: 1 10a 10b 11 2 3 4 5
barplot(y~ID, data=df)

df$ID <- factor(df$ID, levels=levels(df$ID)[gtools::mixedorder(levels(df$ID))])
barplot(y~ID, data=df)

reprex package (v0.3.0)

于 2020-04-26 创建
  • 编辑处理因素重新调平以解决引入的错误。
library(tidyverse)

df <- data.frame(ID=(c("1", "2", "3", "4", "5", "10a", "10b", "11")), 
                 y=c(seq(100,500,100), 150, 155, 180), stringsAsFactors = FALSE)

简单数据的简单修复

df$numId<-1:nrow(df)

ggplot(df, aes(x=reorder(ID,numId), y = y)) +
  geom_col() +
  labs(x='ID', y='Value')

结果

创建一个函数来生成数值

create_id<-function(x) {
  if(!grepl('[a-z]',x,ignore.case = TRUE)) {
    return(as.numeric(x))
  } else {
    letter<-tolower(gsub('[0-9]+',"",x))
    letter_value<-which(letters==letter)/100
    number<-as.numeric(gsub('[a-z]',"",x)) + letter_value
    return(number)
  }
}

df<-df %>%
  group_by(ID, y) %>%
  mutate(nid = round(create_id(ID),3))

ggplot(df, aes(x=reorder(ID,nid), y = y)) +
  geom_col() +
  labs(x='ID', y='Value')

结果

感谢@user12728748 的回答以及提供数据框代码。我的回答只是为了满足问题中的ggplot2标签。上面的答案同样合适。