在某些值不再存在后重构数据框
Re-factor a data frame after some values no longer exist
我正在尝试重构数据框中的所有列因子以减少因子水平的数量。以我为例,在我删除了数据框中大约 50% 的行后,许多列的因子水平值不再存在,我想删除它们。数据框包含很多作为因子的列,因此一次重构它们对我来说变得乏味。
SO 中还有另一个问题 refactor data.frame column values 但它没有解决我的问题,所以我想我会把这个问题放在这里作为参考。
我找到了一些答案 here,我选择的答案来自 Brian Ripley 教授:
ind <- sapply(DF, is.factor)
DF[ind] <- lapply(DF[ind], "[", drop=TRUE)
其中 DF
是数据帧。
我正在尝试重构数据框中的所有列因子以减少因子水平的数量。以我为例,在我删除了数据框中大约 50% 的行后,许多列的因子水平值不再存在,我想删除它们。数据框包含很多作为因子的列,因此一次重构它们对我来说变得乏味。
SO 中还有另一个问题 refactor data.frame column values 但它没有解决我的问题,所以我想我会把这个问题放在这里作为参考。
我找到了一些答案 here,我选择的答案来自 Brian Ripley 教授:
ind <- sapply(DF, is.factor)
DF[ind] <- lapply(DF[ind], "[", drop=TRUE)
其中 DF
是数据帧。