R:跨列的因素作为虚拟变量
R: factors across columns as dummy variable
我在 R 中工作,我需要解决以下问题。
我的数据格式如下。
Users Lang_1 Lang_2 Lang_3 Lang_4 Lang_5
user_1 C SAS Python SPSS Java
user_2 R C++ Java
user_3 SAS R Python Octave
user_4 iPython SQL R
user_5 SQL Java Dot Net Python
并且需要我的输出格式如下
Users C R SAS iPython SQL C++ Java Python DotNet SPSS Octave
user_1 1 0 1 0 0 0 1 1 0 1 0
user_2 0 1 0 0 0 1 1 0 0 0 0
user_3 0 1 1 0 0 0 0 1 0 0 1
user_4 0 1 0 1 1 0 0 0 0 0 0
user_5 0 0 0 0 1 0 1 1 1 0 0
正在尝试使用以上信息进行分类need.Please帮帮我。
library(reshape)
#读取问题数据框
data <- read.csv(file.choose())
#传递id变量的索引
data_m <- melt(data,id.vars = 1)
#删除值列为空白的观察结果
data_m <- data_m[-which(data_m$value==""),]
#删除变量列
data_m <- data_m[,-2]
#命令运行下面的#desired输出
cast(data_m,Users~value,length)
我在 R 中工作,我需要解决以下问题。 我的数据格式如下。
Users Lang_1 Lang_2 Lang_3 Lang_4 Lang_5
user_1 C SAS Python SPSS Java
user_2 R C++ Java
user_3 SAS R Python Octave
user_4 iPython SQL R
user_5 SQL Java Dot Net Python
并且需要我的输出格式如下
Users C R SAS iPython SQL C++ Java Python DotNet SPSS Octave
user_1 1 0 1 0 0 0 1 1 0 1 0
user_2 0 1 0 0 0 1 1 0 0 0 0
user_3 0 1 1 0 0 0 0 1 0 0 1
user_4 0 1 0 1 1 0 0 0 0 0 0
user_5 0 0 0 0 1 0 1 1 1 0 0
正在尝试使用以上信息进行分类need.Please帮帮我。
library(reshape)
#读取问题数据框
data <- read.csv(file.choose())
#传递id变量的索引
data_m <- melt(data,id.vars = 1)
#删除值列为空白的观察结果
data_m <- data_m[-which(data_m$value==""),]
#删除变量列
data_m <- data_m[,-2]
#命令运行下面的#desired输出
cast(data_m,Users~value,length)