如何根据 R 中另一列的值将数据框中列的数据添加到语料库?
How to add data from column in a data frame to a corpus based on a value from another column in R?
所以我有一个数据框,我想根据另一列的值将 CorpusText 列放入语料库。 (最后4列是通过以下实现的:
usersDF$pos.bool <- usersDF$score >= 1
usersDF$neg.bool <- usersDF$score <= -1
usersDF$pos = as.numeric( usersDF$pos.bool )
usersDF$neg = as.numeric( usersDF$neg.bool )
usersDF
Name CorpusText score pos neg pos.bool neg.bool
Rob Text -4 0 1 FALSE TRUE
Sam Text -3 0 1 FALSE TRUE
Lynda Text 1 1 0 TRUE FALSE
Robert Text 2 1 0 TRUE FALSE
RJ Text 6 1 0 TRUE FALSE
Rob Text -2 0 1 FALSE TRUE
Bert Text -1 0 1 FALSE TRUE
我对创建正面和负面情绪语料库很感兴趣,我认为可以通过以下方式实现:
library(tm)
pos.corpus <-Corpus(VectorSource(usersDF$CorpusText, usersDF$pos.bool=="TRUE"))
neg.corpus <-Corpus(VectorSource(usersDF$CorpusText, usersDF$neg.bool=="TRUE"))
或
pos.corpus <- Corpus(VectorSource(usersDF$CorpusText, usersDF$pos=="1"))
neg.corpus <- Corpus(VectorSource(usersDF$CorpusText, usersDF$neg =="1"))
但我每次都收到以下错误:
Error in VectorSource(usersDF$CorpusText, usersDF$... == "...")
unused argument (usersDF$... == "...")
将我的 CorpusText 列中的数据提取到基于 pos 或 pos.bool 列的正语料库以及基于 neg 或 neg.bool 列的负语料库的正确方法是什么?
大脑冻结。感谢@josilber,我意识到我需要的是 []
.
所以:
pos.corpus <- Corpus(VectorSource(usersDF$CorpusText[usersDF$pos==1]))
和
neg.corpus <- Corpus(VectorSource(usersDF$CorpusText[usersDF$neg ==1]))
是解决方案。
所以我有一个数据框,我想根据另一列的值将 CorpusText 列放入语料库。 (最后4列是通过以下实现的:
usersDF$pos.bool <- usersDF$score >= 1
usersDF$neg.bool <- usersDF$score <= -1
usersDF$pos = as.numeric( usersDF$pos.bool )
usersDF$neg = as.numeric( usersDF$neg.bool )
usersDF
Name CorpusText score pos neg pos.bool neg.bool
Rob Text -4 0 1 FALSE TRUE
Sam Text -3 0 1 FALSE TRUE
Lynda Text 1 1 0 TRUE FALSE
Robert Text 2 1 0 TRUE FALSE
RJ Text 6 1 0 TRUE FALSE
Rob Text -2 0 1 FALSE TRUE
Bert Text -1 0 1 FALSE TRUE
我对创建正面和负面情绪语料库很感兴趣,我认为可以通过以下方式实现:
library(tm)
pos.corpus <-Corpus(VectorSource(usersDF$CorpusText, usersDF$pos.bool=="TRUE"))
neg.corpus <-Corpus(VectorSource(usersDF$CorpusText, usersDF$neg.bool=="TRUE"))
或
pos.corpus <- Corpus(VectorSource(usersDF$CorpusText, usersDF$pos=="1"))
neg.corpus <- Corpus(VectorSource(usersDF$CorpusText, usersDF$neg =="1"))
但我每次都收到以下错误:
Error in VectorSource(usersDF$CorpusText, usersDF$... == "...")
unused argument (usersDF$... == "...")
将我的 CorpusText 列中的数据提取到基于 pos 或 pos.bool 列的正语料库以及基于 neg 或 neg.bool 列的负语料库的正确方法是什么?
大脑冻结。感谢@josilber,我意识到我需要的是 []
.
所以:
pos.corpus <- Corpus(VectorSource(usersDF$CorpusText[usersDF$pos==1]))
和
neg.corpus <- Corpus(VectorSource(usersDF$CorpusText[usersDF$neg ==1]))
是解决方案。