在 R 中使用 tidyverse 重新调整因子和重新排序因子
relevel factors and reorder factors using tidyverse in R
我想使用函数 relevel() 和 reorder() 在我的数据框中。我了解 relevel 的工作原理,但我不明白为什么我在 data.frame 中看不到级别的变化。例如假设我有 iris 数据集
library(tidyverse)
head(iris)
#> Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#> 1 5.1 3.5 1.4 0.2 setosa
#> 2 4.9 3.0 1.4 0.2 setosa
#> 3 4.7 3.2 1.3 0.2 setosa
#> 4 4.6 3.1 1.5 0.2 setosa
#> 5 5.0 3.6 1.4 0.2 setosa
#> 6 5.4 3.9 1.7 0.4 setosa
iris$Species <- factor(iris$Species, levels = c("versicolor","setosa","virginica"),
labels = c("versicolor","setosa","virginica"))
由 reprex package (v2.0.1)
于 2022-04-12 创建
我可以使用这个功能来改变关卡的顺序
或者 dplyr 中的这个函数:
iris %>%
mutate(Species=factor(Species)) %>%
mutate(Species=fct_relevel(Species,c("versicolor","setosa","virginica"))) %>%
head()
#> Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#> 1 5.1 3.5 1.4 0.2 setosa
#> 2 4.9 3.0 1.4 0.2 setosa
#> 3 4.7 3.2 1.3 0.2 setosa
#> 4 4.6 3.1 1.5 0.2 setosa
#> 5 5.0 3.6 1.4 0.2 setosa
#> 6 5.4 3.9 1.7 0.4 setosa
由 reprex package (v2.0.1) 于 2022-04-12 创建
我没有得到的是,当我看到数据集中级别的变化时,当我调用我的数据集时,我看不到顺序的变化,这对我来说很重要。
这是我看到的
Species
setosa
...
versicolor
...
virginica
...
这就是我想看到的
Species
versicolor
...
setosa
...
virginica
...
感谢任何帮助实际使用 tidyverse 更改顺序的人。
我们需要重新分配以对原始数据进行更改。除了更改 levels
的顺序外,如果还需要更改行顺序,我们可能还需要 arrange
数据
iris <- iris %>%
mutate(Species=factor(Species)) %>%
mutate(Species=fct_relevel(Species,c("versicolor","setosa","virginica"))) %>%
arrange(Species)
或者可以使用 magrittr
中的赋值运算符 (%<>%
)
library(magrittr)
iris %<>%
mutate(Species=factor(Species)) %<>%
mutate(Species=fct_relevel(Species,c("versicolor","setosa","virginica")))%>%
arrange(Species)
勾选 levels
levels(iris$Species)
[1] "versicolor" "setosa" "virginica"
我想使用函数 relevel() 和 reorder() 在我的数据框中。我了解 relevel 的工作原理,但我不明白为什么我在 data.frame 中看不到级别的变化。例如假设我有 iris 数据集
library(tidyverse)
head(iris)
#> Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#> 1 5.1 3.5 1.4 0.2 setosa
#> 2 4.9 3.0 1.4 0.2 setosa
#> 3 4.7 3.2 1.3 0.2 setosa
#> 4 4.6 3.1 1.5 0.2 setosa
#> 5 5.0 3.6 1.4 0.2 setosa
#> 6 5.4 3.9 1.7 0.4 setosa
iris$Species <- factor(iris$Species, levels = c("versicolor","setosa","virginica"),
labels = c("versicolor","setosa","virginica"))
由 reprex package (v2.0.1)
于 2022-04-12 创建我可以使用这个功能来改变关卡的顺序 或者 dplyr 中的这个函数:
iris %>%
mutate(Species=factor(Species)) %>%
mutate(Species=fct_relevel(Species,c("versicolor","setosa","virginica"))) %>%
head()
#> Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#> 1 5.1 3.5 1.4 0.2 setosa
#> 2 4.9 3.0 1.4 0.2 setosa
#> 3 4.7 3.2 1.3 0.2 setosa
#> 4 4.6 3.1 1.5 0.2 setosa
#> 5 5.0 3.6 1.4 0.2 setosa
#> 6 5.4 3.9 1.7 0.4 setosa
由 reprex package (v2.0.1) 于 2022-04-12 创建 我没有得到的是,当我看到数据集中级别的变化时,当我调用我的数据集时,我看不到顺序的变化,这对我来说很重要。 这是我看到的
Species
setosa
...
versicolor
...
virginica
...
这就是我想看到的
Species
versicolor
...
setosa
...
virginica
...
感谢任何帮助实际使用 tidyverse 更改顺序的人。
我们需要重新分配以对原始数据进行更改。除了更改 levels
的顺序外,如果还需要更改行顺序,我们可能还需要 arrange
数据
iris <- iris %>%
mutate(Species=factor(Species)) %>%
mutate(Species=fct_relevel(Species,c("versicolor","setosa","virginica"))) %>%
arrange(Species)
或者可以使用 magrittr
%<>%
)
library(magrittr)
iris %<>%
mutate(Species=factor(Species)) %<>%
mutate(Species=fct_relevel(Species,c("versicolor","setosa","virginica")))%>%
arrange(Species)
勾选 levels
levels(iris$Species)
[1] "versicolor" "setosa" "virginica"