埃德加包 | .txt 文件问题
Edgar Package | Issue with .txt files
提前感谢您的投入。
我的问题是 edgar 包的 getSentimentCount(word.frq, words.list)
功能。该函数应该读取 word.list
这是一个 .txt 文件并比较另一个现有列表 (word.frq)
的内容,也是一个 .txt 文件。
这对于一个单词之间没有空格的 .txt 文件来说效果很好,但 R 仍然可以像有(计数 > 1)一样读取文件。如果每个单词后都有一个新行,则可以读取另一个文件(计数 > 1),但会导致 getSentimentCount(word.frq, words.list)
函数出错。如果 .txt 文件中的新行被剥离并且所有单词都放在一行(与其他文件一样),那么 R 只能读取一个单词(基本上是一行中的所有单词)并且计数 = 1.
R 是否区分不同类型的 .txt 文件?
LINK 到两个 .txt 文件。 negwords.txt
有效,litwords.txt
导致错误。
非常感谢任何意见。
R只读取nospace
txt中的一个单词是正常的:对于R来说,这只是一个字符串,没有任何分隔符。
我阅读其他文档没有任何问题:
library(edgar)
wf <- getWordfrquency("R/litwords_space.txt")
neg <- readLines("R/negwords.txt")
wgs <- getSentimentCount(word.frq = wf, words.list = neg)
目前,您的单词列表仅包含出现一次的单词,因此频率 table 将始终为一个。
如果您对文本挖掘和情感分析感兴趣,我强烈建议您切换到 tidytext
包。
科林
已解决:函数getSentimentCount(word.frq, words.list)
只读取.txt (MS-DOS)
。
提前感谢您的投入。
我的问题是 edgar 包的 getSentimentCount(word.frq, words.list)
功能。该函数应该读取 word.list
这是一个 .txt 文件并比较另一个现有列表 (word.frq)
的内容,也是一个 .txt 文件。
这对于一个单词之间没有空格的 .txt 文件来说效果很好,但 R 仍然可以像有(计数 > 1)一样读取文件。如果每个单词后都有一个新行,则可以读取另一个文件(计数 > 1),但会导致 getSentimentCount(word.frq, words.list)
函数出错。如果 .txt 文件中的新行被剥离并且所有单词都放在一行(与其他文件一样),那么 R 只能读取一个单词(基本上是一行中的所有单词)并且计数 = 1.
R 是否区分不同类型的 .txt 文件?
LINK 到两个 .txt 文件。 negwords.txt
有效,litwords.txt
导致错误。
非常感谢任何意见。
R只读取nospace
txt中的一个单词是正常的:对于R来说,这只是一个字符串,没有任何分隔符。
我阅读其他文档没有任何问题:
library(edgar)
wf <- getWordfrquency("R/litwords_space.txt")
neg <- readLines("R/negwords.txt")
wgs <- getSentimentCount(word.frq = wf, words.list = neg)
目前,您的单词列表仅包含出现一次的单词,因此频率 table 将始终为一个。
如果您对文本挖掘和情感分析感兴趣,我强烈建议您切换到 tidytext
包。
科林
已解决:函数getSentimentCount(word.frq, words.list)
只读取.txt (MS-DOS)
。