子集变量
Subsetting Variables
我目前正在处理一个相当大的数据集,并且希望对我的一些变量进行子集化。
我实际上是在尝试 select 一系列变量,然后在该函数中添加一个变量,然后切换回 select 范围。
例如:
items_data = subset(dataset, select = q1:19, q20, q33:35, q50)
但是我认为逗号引起了一些问题。
我一直在网上搜索解决方案,但只遇到了更麻烦的脚本,而且我知道有一个更简单的解决方案。
如有任何帮助,我们将不胜感激。
谢谢!
您可以执行以下操作:
基础 R
items_data = dataset[,c(1:20, 33:35, 50)]
Dplyr
#install.packages('dplyr')
library(dplyr)
items_data = select(dataset, 1:20, 33:35, 50)
请注意,数字是列索引位置,如果您的数据集发生变化,它将拉取的列也会发生变化。您也可以改用列的名称,以确保如果您的数据集发生变化,它将继续提取相同的字段。
我目前正在处理一个相当大的数据集,并且希望对我的一些变量进行子集化。
我实际上是在尝试 select 一系列变量,然后在该函数中添加一个变量,然后切换回 select 范围。
例如:
items_data = subset(dataset, select = q1:19, q20, q33:35, q50)
但是我认为逗号引起了一些问题。
我一直在网上搜索解决方案,但只遇到了更麻烦的脚本,而且我知道有一个更简单的解决方案。
如有任何帮助,我们将不胜感激。
谢谢!
您可以执行以下操作:
基础 R
items_data = dataset[,c(1:20, 33:35, 50)]
Dplyr
#install.packages('dplyr')
library(dplyr)
items_data = select(dataset, 1:20, 33:35, 50)
请注意,数字是列索引位置,如果您的数据集发生变化,它将拉取的列也会发生变化。您也可以改用列的名称,以确保如果您的数据集发生变化,它将继续提取相同的字段。