在数据框中的列中查找出现频率最低的字符

Find least frequently occurring character in a column in dataframe

我正在使用 nycflights13 包中的飞机数据集。我想在 planes 数据集中找到 Find the least frequently occurring character From tailnum 列。

我尝试使用 str_split & boundary() 但不知道如何继续

 library(tidyverse)
 library(nycflights13)
 planes<- nycflights13::planes

 strsplit(word(planes$tailnum),boundary("character")) 

将每个单词拆分为字符,使用 tablesort 和 select 第一个值来计算它们。

sort(table(unlist(strsplit(planes$tailnum, ''))))[1]

#G 
#9 

或使用tidyverse

library(dplyr)
library(tidyr)

planes %>%
  separate_rows(tailnum, sep = '') %>%
  filter(tailnum != '') %>%
  count(tailnum) %>%
  slice_min(n, n = 1)

#  tailnum     n
#  <chr>   <int>
#1 G           9