将列的值分隔或分组为 R 中的不同类别

Separating or grouping Values of a column into different categories in R

大家早上好。 拜托,我确实有一个问题,我现在已经有一段时间无法解决了。(请看一下图片 link 以查看我的数据集的屏幕截图)https://i.stack.imgur.com/g2eTM.jpg

我有一列数据 (status) 包含两组值(1 和 2)。 这些是代表两个类别(或状态)的因变量(比如 Pp 和 Pt)的虚拟变量,我需要进行回归。 它们的实际值包含在最后一列 Pp.Pt(Pp.Pt只是一个名字而已).

我需要 运行 两个单独的回归,每个回归使用 Pp 或 Pt(意思是在 Pp.Pt 列中使用它们各自的值 (每个值在最后一列是状态 1 或状态 2) 。**我的问题是如何将它们分开或将它们分组到这两个类别中 1= Pp 和 2 = Pt 以便我可以清楚地识别和分组它们。

https://i.stack.imgur.com/g2eTM.jpg

非常感谢您的热心帮助。 最好 卢多维奇

这种方法可以解决您的问题

yourdata %>%
mutate(classofyourcolumn=ifelse(columntosplit<quantile(columntosplit,0.5),1,0))  

Split-Apply-Combine方法:

# Using the mtcars dataset as an example: 
df <- mtcars

# Allocate some memory for a list storing the split data.frame: 
# df_list => empty list with the number of elements of the unique
# values of the cyl vector
df_list <- vector("list", length(unique(df$cyl)))

# Split the data.frame by the cyl vector: 
df_list <- split(df, df$cyl)

# Apply the regression model, return the summary data: 
lapply(df_list, function(x){
  summary(lm(mpg ~ hp, data = x))
  }
)