R:通过 recipies 包对分类变量进行频率编码
R: frequency encoding for categorical variables via recipies package
我正在寻找类似于 https://rdrr.io/github/bfgray3/cattonum/man/catto_freq.html
的功能
但实现为 recipes::step_ 函数 (https://tidymodels.github.io/recipes/reference/index.html)
有人知道这方面的实施吗? :)
您应该在没有配方的情况下进行编码,因为目前配方中不支持组。 step_count 用于计算匹配模式的字符数。
例如:
recipe(survived ~ ., data = train %>%
group_by(ticket) %>%
mutate(n_ticket = n()) %>%
ungroup()
) %>%
step_rm("ticket")
我正在寻找类似于 https://rdrr.io/github/bfgray3/cattonum/man/catto_freq.html
的功能但实现为 recipes::step_ 函数 (https://tidymodels.github.io/recipes/reference/index.html)
有人知道这方面的实施吗? :)
您应该在没有配方的情况下进行编码,因为目前配方中不支持组。 step_count 用于计算匹配模式的字符数。
例如:
recipe(survived ~ ., data = train %>%
group_by(ticket) %>%
mutate(n_ticket = n()) %>%
ungroup()
) %>%
step_rm("ticket")