将 lexisnexis 输出导入 R quanteda
Import lexisnexis output into R quanteda
我会使用 Benoit 的 R 包 quanteda 来分析从 lexisnexis 导出的文章。导出为标准 html 格式。我使用 tm 包 + 插件来读取 lexisnexis 输出。不幸的是,在将 tm-corpus 转换为 quanteda-corpus 时出现错误。是那个功能坏了,还是我之前弄错了什么?
library("tm")
library("tm.plugin.lexisnexis")
library("quanteda")
ln <- LexisNexisSource("lexisnexisOutput.html")
cr <- Corpus(ln)
crp <- corpus(cr)
Error in UseMethod("corpus") :
no applicable method for 'corpus' applied to an object of class "list"
In addition: Warning message:
In corpus(texts, docvars = metad, source = paste("Converted from tm VCorpus '", :
Arguments docvarssource not used.
这是 corpus.VCorpus()
的限制,因为文本是 char 类型的向量,而不仅仅是单个 char 类型。已在 quanteda 0.9.1-6 中修复。参见 Issue #80 on GitHub。
我会使用 Benoit 的 R 包 quanteda 来分析从 lexisnexis 导出的文章。导出为标准 html 格式。我使用 tm 包 + 插件来读取 lexisnexis 输出。不幸的是,在将 tm-corpus 转换为 quanteda-corpus 时出现错误。是那个功能坏了,还是我之前弄错了什么?
library("tm")
library("tm.plugin.lexisnexis")
library("quanteda")
ln <- LexisNexisSource("lexisnexisOutput.html")
cr <- Corpus(ln)
crp <- corpus(cr)
Error in UseMethod("corpus") :
no applicable method for 'corpus' applied to an object of class "list"
In addition: Warning message:
In corpus(texts, docvars = metad, source = paste("Converted from tm VCorpus '", :
Arguments docvarssource not used.
这是 corpus.VCorpus()
的限制,因为文本是 char 类型的向量,而不仅仅是单个 char 类型。已在 quanteda 0.9.1-6 中修复。参见 Issue #80 on GitHub。