子集变量

Question

我目前正在处理一个相当大的数据集，并且希望对我的一些变量进行子集化。

我实际上是在尝试 select 一系列变量，然后在该函数中添加一个变量，然后切换回 select 范围。

例如：

items_data = subset(dataset, select = q1:19, q20, q33:35, q50)

但是我认为逗号引起了一些问题。

我一直在网上搜索解决方案，但只遇到了更麻烦的脚本，而且我知道有一个更简单的解决方案。

如有任何帮助，我们将不胜感激。

谢谢！

Answer 1

您可以执行以下操作：

基础 R

items_data = dataset[,c(1:20, 33:35, 50)]

Dplyr

#install.packages('dplyr')
library(dplyr)

items_data = select(dataset, 1:20, 33:35, 50)

请注意，数字是列索引位置，如果您的数据集发生变化，它将拉取的列也会发生变化。您也可以改用列的名称，以确保如果您的数据集发生变化，它将继续提取相同的字段。

Subsetting Variables