在数据框中的列中查找出现频率最低的字符

Question

我正在使用 nycflights13 包中的飞机数据集。我想在 planes 数据集中找到 Find the least frequently occurring character From tailnum 列。

我尝试使用 str_split & boundary() 但不知道如何继续

 library(tidyverse)
 library(nycflights13)
 planes<- nycflights13::planes

 strsplit(word(planes$tailnum),boundary("character"))

Answer 1

将每个单词拆分为字符，使用 table、sort 和 select 第一个值来计算它们。

sort(table(unlist(strsplit(planes$tailnum, ''))))[1]

#G 
#9

或使用tidyverse：

library(dplyr)
library(tidyr)

planes %>%
  separate_rows(tailnum, sep = '') %>%
  filter(tailnum != '') %>%
  count(tailnum) %>%
  slice_min(n, n = 1)

#  tailnum     n
#  <chr>   <int>
#1 G           9

在数据框中的列中查找出现频率最低的字符

Find least frequently occurring character in a column in dataframe

r

stringr

dplyr

tidyverse