R 中的小提琴图将大多数组分到 "other" 类别?

Violin plot in R binning most groups into an "other" category?

我有一个数据框,我目前正在按类别分组,其中有大约一千个项目。这会创建一个过宽的图表,我实际上对其中的大部分数据都不感兴趣,因为它们都很相似.

我想要的是仅查看最大值高于阈值的项目的图,并可能将所有其他项目组合到一个 "other" 类别中。

有固定的方法吗?

来自 forcats package

fct_lump() 可能有效。

您需要先按比例处理值,但它有参数 prop,其中 "preserves values that occur at least prop of the time"(它将其余部分分组为 "Other" 级别)。

另外还有一个 n 参数来表示要保留的级别数(也将其余的分组到 "Other" 级别)。

这里有点more information about forcats.