R:通过 recipies 包对分类变量进行频率编码

R: frequency encoding for categorical variables via recipies package

我正在寻找类似于 https://rdrr.io/github/bfgray3/cattonum/man/catto_freq.html

的功能

但实现为 recipes::step_ 函数 (https://tidymodels.github.io/recipes/reference/index.html)

有人知道这方面的实施吗? :)

您应该在没有配方的情况下进行编码,因为目前配方中不支持组。 step_count 用于计算匹配模式的字符数。

例如:

recipe(survived ~ ., data = train %>% 
        group_by(ticket) %>% 
        mutate(n_ticket = n()) %>% 
        ungroup()
    ) %>% 
    step_rm("ticket")