矿业金融篇R
Mining financial articles R
我正在使用 tidytext 挖掘一些金融文章,我从路透社下载数据,但是当我尝试将每个语料库转换为数据框时,我遇到了一些关于 unnest 命令未将函数作为输入的错误...
你有什么办法可以把它变成小标题吗?
library(tm.plugin.webmining)
library(purrr)
company <- c("Microsoft", "Apple", "Google", "Amazon", "Facebook",
"Twitter", "IBM", "Yahoo", "Netflix")
symbol <- c("MSFT", "AAPL", "GOOG", "AMZN", "FB", "TWTR", "IBM", "YHOO", "NFLX")
download_articles <- function(symbol) {
WebCorpus(ReutersNewsSource(paste0("NASDAQ:", symbol)))
}
stock_articles <- data_frame(company = company, symbol = symbol) %>%
mutate(corpus = map(symbol, download_articles))
stock_articles
stock_tokens <- stock_articles %>%
unnest(map(corpus, tidy)) %>%
unnest_tokens(word, text) %>%
select(company, datetimestamp, word, id, heading)
stock_tokens
我正在尝试将 stock_articles 的语料库列转换为常规数据框
它是一个带有 WebCorpus 类型变量的列表列,所以我试图整理每个观察结果,然后使用 unnest
将其变成一个列
[1]: https://github.com/leytigeorges/miningfinancial 在这里您可以找到包含数据 (mydata)
的文件
这里发生的事情是一些服务已被弃用,不幸的是,tm.plugin.webmining 已过时。您可以阅读一些 more details here。我们正在为本书的这一部分寻找替代数据集,但与此同时,如果您想探索使用此代码,我建议您精简到 4 家似乎仍在运作的公司。
symbol <- c("MSFT", "AAPL", "AMZN", "IBM")
我正在使用 tidytext 挖掘一些金融文章,我从路透社下载数据,但是当我尝试将每个语料库转换为数据框时,我遇到了一些关于 unnest 命令未将函数作为输入的错误...
你有什么办法可以把它变成小标题吗?
library(tm.plugin.webmining)
library(purrr)
company <- c("Microsoft", "Apple", "Google", "Amazon", "Facebook",
"Twitter", "IBM", "Yahoo", "Netflix")
symbol <- c("MSFT", "AAPL", "GOOG", "AMZN", "FB", "TWTR", "IBM", "YHOO", "NFLX")
download_articles <- function(symbol) {
WebCorpus(ReutersNewsSource(paste0("NASDAQ:", symbol)))
}
stock_articles <- data_frame(company = company, symbol = symbol) %>%
mutate(corpus = map(symbol, download_articles))
stock_articles
stock_tokens <- stock_articles %>%
unnest(map(corpus, tidy)) %>%
unnest_tokens(word, text) %>%
select(company, datetimestamp, word, id, heading)
stock_tokens
我正在尝试将 stock_articles 的语料库列转换为常规数据框
它是一个带有 WebCorpus 类型变量的列表列,所以我试图整理每个观察结果,然后使用 unnest
将其变成一个列[1]: https://github.com/leytigeorges/miningfinancial 在这里您可以找到包含数据 (mydata)
的文件这里发生的事情是一些服务已被弃用,不幸的是,tm.plugin.webmining 已过时。您可以阅读一些 more details here。我们正在为本书的这一部分寻找替代数据集,但与此同时,如果您想探索使用此代码,我建议您精简到 4 家似乎仍在运作的公司。
symbol <- c("MSFT", "AAPL", "AMZN", "IBM")