在数据框中的列中查找出现频率最低的字符
Find least frequently occurring character in a column in dataframe
我正在使用 nycflights13 包中的飞机数据集。我想在 planes 数据集中找到 Find the least frequently occurring character From tailnum 列。
我尝试使用 str_split & boundary() 但不知道如何继续
library(tidyverse)
library(nycflights13)
planes<- nycflights13::planes
strsplit(word(planes$tailnum),boundary("character"))
将每个单词拆分为字符,使用 table
、sort
和 select 第一个值来计算它们。
sort(table(unlist(strsplit(planes$tailnum, ''))))[1]
#G
#9
或使用tidyverse
:
library(dplyr)
library(tidyr)
planes %>%
separate_rows(tailnum, sep = '') %>%
filter(tailnum != '') %>%
count(tailnum) %>%
slice_min(n, n = 1)
# tailnum n
# <chr> <int>
#1 G 9
我正在使用 nycflights13 包中的飞机数据集。我想在 planes 数据集中找到 Find the least frequently occurring character From tailnum 列。
我尝试使用 str_split & boundary() 但不知道如何继续
library(tidyverse)
library(nycflights13)
planes<- nycflights13::planes
strsplit(word(planes$tailnum),boundary("character"))
将每个单词拆分为字符,使用 table
、sort
和 select 第一个值来计算它们。
sort(table(unlist(strsplit(planes$tailnum, ''))))[1]
#G
#9
或使用tidyverse
:
library(dplyr)
library(tidyr)
planes %>%
separate_rows(tailnum, sep = '') %>%
filter(tailnum != '') %>%
count(tailnum) %>%
slice_min(n, n = 1)
# tailnum n
# <chr> <int>
#1 G 9