子集变量

Subsetting Variables

我目前正在处理一个相当大的数据集,并且希望对我的一些变量进行子集化。

我实际上是在尝试 select 一系列变量,然后在该函数中添加一个变量,然后切换回 select 范围。

例如:

items_data = subset(dataset, select = q1:19, q20, q33:35, q50)

但是我认为逗号引起了一些问题。

我一直在网上搜索解决方案,但只遇到了更麻烦的脚本,而且我知道有一个更简单的解决方案。

如有任何帮助,我们将不胜感激。

谢谢!

您可以执行以下操作:

基础 R

items_data = dataset[,c(1:20, 33:35, 50)]

Dplyr

#install.packages('dplyr')
library(dplyr)

items_data = select(dataset, 1:20, 33:35, 50)

请注意,数字是列索引位置,如果您的数据集发生变化,它将拉取的列也会发生变化。您也可以改用列的名称,以确保如果您的数据集发生变化,它将继续提取相同的字段。